Python有以下三个特点:

  • 易用性和灵活性
  • 全行业高接受度:Python无疑是业界最流行的数据科学语言
  • 用于数据科学的Python库的丰富数量优势

本文介绍了python人最常用的59个python库。一起来看看吧~

 

用于数据收集的Python库

1. Beautiful Soup-是一个HTML和XML解析器,可为被解析的页面创建解析树,从而用于从web页面中提取数据

2. Scrapy-一个可有效用于网页抓取的Python库

3. Selenium一个用于大规模网页抓取的框架

 

用于数据清理和数据操作的Python库

4. Pandas-主要用于数据操作和数据分析

5. PyOD-是一个全面的、可伸缩的Python工具包,用于检测外围对象

6. NumPy-引入了支持大型多维数组和矩阵的函数,同时还引入了高级数学函数来处理这些数组和矩阵

7. Spacy-一个非常有用且灵活的自然语言处理( NLP )库和框架,用于清理创建模型的文本文档

 

用于数据可视化的Python库

8. Matplotlib-是Python中最流行的数据可视化库,Python 2D 绘图库

9. Seaborn-一个基于matplotlib的绘图库

10. Bokeh-一个面向现代网页浏览器的交互式可视化库

11. plotly – 协同 Python 和 matplotlib 工作的 web 绘图库。

 

用来进行科学计算和数据分析的库

12. bcbio-nextgen – 这个工具箱为全自动高通量测序分析提供符合最佳实践的处理流程。

13. blaze – NumPy 和 Pandas 的大数据接口。

14. cclib – 一个用来解析和解释计算化学软件包输出结果的库。

15. NetworkX – 一个为复杂网络设计的高性能软件。

16. Neupy – 执行和测试各种不同的人工神经网络算法。

17. Numba – Python JIT (just in time) 编译器,针对科学用的 Python ,由Cython 和 NumPy 的开发者开发。

18. NumPy – 使用 Python 进行科学计算的基础包。

19. Open Mining – 使用 Python 挖掘商业情报 (BI) (Pandas web 接口)。

20. orange – 通过可视化编程或 Python 脚本进行数据挖掘,数据可视化,分析和机器学习。

21. Pandas – 提供高性能,易用的数据结构和数据分析工具。

22. PyDy –用来为动力学运动建模工作流程提供帮助

23. SciPy – 用于数学,科学和工程的开源软件构成的生态系统。

24. statsmodels – 统计建模和计量经济学。

25. SymPy – 一个用于符号数学的 Python 库。

26. zipline – 一个 Python 算法交易库。

 

用于建模的Python库

27. Scikit-learn-是Python构建模型中的佼佼者

28. TensorFlow-是一个流行的深度学习库,可帮助构建、培训不同模型

29. PyTorch-一个基于Python的科学计算包

 

用于模型解释的Python库

30. Lime-是一种算法(库),可以解释任何分类器或回归量的预测

31. H2O-无人驾驶AI,提供简单的数据可视化技术

 

用于语音处理的Python库

32. Librosa-一个用于音乐和音频分析的Python库

33. Madmom-一个用于音频数据分析的很棒的Python库

34. pyAudioAnalysis-一个用于音频特征提取、分类和分段的Python库

 

用于图像处理的Python库

35. OpenCV-Python-主要用于解决计算机视觉问题

36. Scikit-image-用于执行多个不同图像处理任务的算法集合。可用于图像分割、几何变换、色彩空间操作、分析、过滤,形态学、特征检测等等

37. Pillow-是一个更加易用版的PIL

 

作为数据库的Python库

38. Psycopg-是Python编程语言中最流行的PostgreSQL(高级开源代码关系数据库)适配器

39. SQLAlchemy-SQL是最流行的数据库语言。SQLAlchemy是pythonSQL工具包和对象关系映射器。

 

用于WEB的Python库

40. Flask-一个用Python编写的Web框架,广泛用于部署数据科学模型

41. Requests:-优雅,简单,人性化的 HTTP 库

42. HTTPie-人性化的类似 cURL 命令行的 HTTP 客户端

43. ProxMon: -处理代理日志和报告发现的问题

44. WSMap: --寻找 Web 服务器和发现文件

45. Twill: --从命令行界面浏览网页。支持自动化网络测试

 

用于文本处理的Python库

46. Chardet–字符编码检测器,兼容 Python2 和 Python3。

47. Ftfy–让Unicode文本更完整更连贯。

48. Unidecode–Unicode 文本的 ASCII 转换形式 。

49. Xpinyin–一个用于把汉字转换为拼音的库。

50. difflib–(Python 标准库)帮助我们进行差异化比较。

51. fuzzywuzzy–模糊字符串匹配。

 

用于特殊文本格式处理的Python库

52. tablib – 一个用来处理中表格数据的模块。

53. PDFMiner – 一个用于从PDF文档中抽取信息的工具。

54. PyPDF2 – 一个可以分割,合并和转换 PDF 页面的库。

55. openpyxl – 一个用来读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件的库

56. XlsxWriter – 一个用于创建 Excel .xlsx 文件的 Python 模块

 

用于集成开发环境的Python库

57. PyCharm – 商业化的 Python IDE ,由 JetBrains 开发。也有免费的社区版提供。

58. LiClipse – 基于 Eclipse 的免费多语言 IDE 。使用 PyDev 来支持 Python 。

59. Spyder – 开源 Python IDE。

 


 

总结

当然,这里总结的库可以说只是python库的冰山一角。如果你遇到问题,那么请第一时间去查找python的第三方扩展库,因为90%以上的问题,python强大的扩展库都能解决。

(PS:如果觉得有用,点赞收藏走一波吧~)