机器学习库
机器学习
⼀個很棒的機器學習框架、庫和軟件的精選列表(按語⾔)。靈感來⾃於 awesome-php。
计算机视觉
Scikit-Image - Python 中图像处理算法的集合。
Scikit-Opt - Python 中的智能(Python 中的遗传算法、粒⼦优化、模拟退⽕、蚁算法、免疫算法、⼈⼯鱼算法)
SimpleCV - ⼀个开源计算机视觉框架,可以访问多个⾼性能计算机视觉库,例如 OpenCV。⽤ Python 编写,可在 Mac、Windows 和Ubuntu Linux 上运⾏。
python新手适合的软件
Vigranumpy - VIGRA C++ 计算机视觉库的 Python 绑定。
OpenFace - 使⽤深度神经⽹络进⾏免费和开源的⼈脸识别。
face_recognition - 从 Python 或命令⾏识别和操作⼈脸的⼈脸识别库。
dockerface - 易于安装和使⽤的对于 docker 容器中的图像和视频深度学习 Faster R-CNN ⼈脸检测.
detectron2 - FAIR ⽤于⽬标检测和分割的下⼀代研究平台。它是对之前版本 Detectron 的彻底重写,由 PyTorch 深度学习框架提供⽀持。
albumentations - ⼀个快速且框架不可知的图像增强库,它实现了多种增强技术。⽀持开箱即⽤( out of the box)的分类、分割、检测。曾在 Kaggle、Topcoder 和那些作为 CVPR 研讨会⼀部分的深度学习竞赛中获胜。
pytessarct - Python-tesseract 是 Python 的光学字符识别(OCR)⼯具。也就是说,它将识别并“读取”嵌⼊在图像中的⽂本。Python-tesseract 是 Google 的 Tesseract-OCR 引擎的包装器。
imutils - ⼀个包含Convenience functions的库,可以使⽤ OpenCV 和 Python 使基本的图像处理操作(如平移、旋转、调整⼤⼩、⾻架化和显⽰ Matplotlib 图像更容易)。
PyTorchCV - 基于 PyTorch 的计算机视觉深度学习框架。
Neuro-style-pt - Justin Johnson 的神经风格(神经风格转移)的 PyTorch 实现。
Detecto - ⽤ 5-10 ⾏代码训练和运⾏计算机视觉模型。
Neuro-dream - DeepDream 的 PyTorch 实现。
Openpose - ⽤于⾝体、⾯部、⼿和脚估计的实时多⼈关键点检测库
Deep High-Resolution-Net - CVPR2019 论⽂“Deep High-Resolution Representation Learning for Human Pose Estimation”的 PyTorch 实现
Dream-creator - DeepDream 的 PyTorch 实现。允许个⼈使⽤ DeepDream 的⾃定义数据集快速轻松地训练他们⾃⼰的⾃定义GoogleNet 模型。
Lucent - Tensorflow 和 OpenAI Clarity 的 Lucid 适⽤于 PyTorch.
lightly - Lightly 是⼀种⽤于⾃监督学习的计算机视觉框架。
Learnergy - 基于 PyTorch 的基于能量的机器学习模型。
OpenVisionAPI - 基于开源模型的开源计算机视觉 API。
Natural Language Processing(⾃然语⾔处理)
pkuseg-python - 更好的jieba版本,由北京⼤学开发。
NLTK - ⽤于构建 Python 程序以处理⼈类语⾔数据的领先平台。
Pattern - Python 编程语⾔的 Web 挖掘模块。它具有⽤于⾃然语⾔处理、机器学习等的⼯具。
Quepy - 将⾃然语⾔问题转换为数据库查询语⾔查询的 Python 框架。
TextBlob - 为深⼊研究常见的⾃然语⾔处理 (NLP) 任务提供⼀致的 API。站在 NLTK 和 Pattern 的巨⼤肩膀上,并与两者配合得很好。
YAlign - ⼀个句⼦对齐器,⼀个友好的⼯具,⽤于从可⽐较的语料库中提取平⾏句⼦。 [已弃⽤]
jieba - 中⽂分词实⽤程序。
SnowNLP - 处理中⽂⽂本的库。
spammy - 基于 nltk 构建的⽤于电⼦邮件垃圾邮件过滤的库
loso - 另⼀个中⽂分割库。 [已弃⽤]
genius - 基于条件随机场的中⽂段。Genius是⼀个开源的python中⽂分词组件,采⽤ CRF(Conditional Random Field)条件随机场算法。
KoNLPy - ⽤于韩语⾃然语⾔处理的 Python 包。
nut - ⾃然语⾔理解⼯具包。 [已弃⽤]
Rosetta - ⽂本处理⼯具和包装器(例如 Vowpal Wabbit)
BLLIP Parser - BLLIP ⾃然语⾔解析器(也称为 Charniak-Johnson 解析器)的 Python 绑定。 [已弃⽤]
PyNPl - Python ⾃然语⾔处理库。 Python 的通⽤ NLP 库。还包含⼀些⽤于解析常见 NLP 格式的特定模块,最显着的是 FoLiA,还有ARPA 语⾔模型、Moses 短语表、GIZA++ 对齐。
PySS3 - Python 包,它实现了⼀种⽤于⽂本分类的新型⽩盒机器学习模型,称为 SS3。由于 SS3 能够直观地解释其基本原理,因此该软件包还附带易于使⽤的交互式可视化⼯具(在线演⽰)。
python-ucto - Python 绑定到 ucto(⽤于各种语⾔的基于 unicode 的规则标记器)。
python-frog - Python 绑定到 Frog,荷兰语的 NLP 套件。 (pos 标记、词形还原、依赖解析、NER)
python-zpar - ZPar 的 Python 绑定,⼀种统计词性标注器、选区解析器和英语依赖解析器。
colibri-core - Python 绑定到 C ++ 库,⽤于以快速且节省内存的⽅式提取和处理基本语⾔结构,例如 n-gram 和 skipgram。
spaCy - 具有 Python 和 Cython 的⼯业强度 NLP。
PyStanfordDependencies - ⽤于将 Penn Treebank 树转换为 Stanford Dependencies 的 Python 接⼝。
距离 - Levenshtein 和 Hamming 距离计算。 [已弃⽤]
Fuzzy Wuzzy - Python 中的模糊字符串匹配。
jellyfish - ⽤于对字符串进⾏近似和语⾳匹配的 Python 库。
editdistance - 编辑距离的快速实现。
textacy - 基于 Spacy 的更⾼级别的 NLP。
stanford-corenlp-python - 斯坦福 CoreNLP 的 Python 包装器 [已弃⽤]
CLTK - 经典语⾔⼯具包。
Rasa - ⼀个“机器学习框架,⽤于⾃动化基于⽂本和语⾳的对话。”
yase - 将句⼦(或其他序列)转码为词向量列表。
Polyglot - 多语⾔⽂本 (NLP) 处理⼯具包。
DrQA - 阅读来回答开放领域的问题。
Dedupe - ⽤于准确和可扩展的模糊匹配、记录重复数据删除和实体解析的 Python 库。
Snips NLU - ⽤于意图分类和实体提取的⾃然语⾔理解库
NeuroNER - 使⽤神经⽹络进⾏命名实体识别,提供最先进的结果
DeepPavlov - 具有许多预训练的俄罗斯 NLP 模型的对话 AI 库。
BigARTM - 主题建模平台。
NALP - 基于 Tensorflow 构建的⾃然对抗性语⾔处理框架。
DL Translate - ⼀个基于深度学习的 50 种语⾔之间的翻译库,使⽤转换器构建。
General-Purpose machine learning (多⽤途的机器学习)(通⽤机器学习)
Microsoft ML for Apache Spark -> 分布式机器学习框架 Apache Spark
Shapley -> ⼀个数据驱动的框架,⽤于量化机器学习集成中分类器的价值。
igel -> ⼀个令⼈愉快的机器学习⼯具,允许您在不编写代码的情况下训练/拟合、测试和使⽤模型
ML 模型构建 -> 包含分类、聚类、回归、推荐笔记本的存储库,并带有插图来制作它们。
ML/DL 项⽬模板
PyTorch Geometric Temporal -> ⽤于动态图表⽰学习的 PyTorch Geometric 的时间扩展。
Little Ball of Fur -> NetworkX 的图形采样扩展库,具有类似 Scikit-Learn 的 API。
空⼿道俱乐部 -> ⼀个⽤于 NetworkX 的⽆监督机器学习扩展库,具有类似 Scikit-Learn 的 API。
Auto_ViML -> 快速⾃动构建变体可解释 ML 模型! Auto_ViML 发⾳为“auto vimal”,是⼀个全⾯且可扩展的 Python AutoML ⼯具包,具有不平衡处理、集成、堆叠和内置特征选择。精选在 Medium ⽂章中。
PyOD -> Python Outlier Detection,全⾯且可扩展的 Python ⼯具包,⽤于检测多元数据中的外围对象。精选⾼级模型,包括神经⽹络/深度学习和异常值集成。
steppy -> 轻量级的 Python 库,⽤于快速且可重复的机器学习实验。引⼊了⼀个⾮常简单的界⾯,可以实现⼲净的机器学习管道设计。
steppy-toolkit -> 精选的神经⽹络、转换器和模型集合,使您的机器学习⼯作更快、更有效。
CNTK - Microsoft Cognitive Toolkit (CNTK),⼀个开源深度学习⼯具包。⽂档可以在这⾥到。
Couler - ⽤于在不同⼯作流引擎(例如 Argo Workflows、Tekton Pipelines 和 Apache Airflow)上构建和管理机器学习⼯作流的统⼀接⼝。
auto_ml - ⽤于⽣产和分析的⾃动化机器学习。让您专注于 ML 的有趣部分,同时输出可⽤于⽣产的代码以及数据集和结果的详细分析。包括对 NLP、XGBoost、CatBoost、LightGBM 以及即将推出的深度学习的⽀持。
机器学习 - 由 Web 界⾯和⼀组编程界⾯ API 组成的⾃动构建,⽤于⽀持向量机。相应的数据集存储在 SQL 数据库中,然后⽣成的⽤于预测的模型存储在 NoSQL 数据存储中。
XGBoost - ⽤于 eXtreme Gradient Boosting(树)库的 Python 绑定。
Apache SINGA - ⼀个⽤于开发开源机器学习库的 Apache Incubating 项⽬。
Bayesian Methods for Hackers - 关于 Python 概率编程的书籍/iPython 笔记本。
Featureforge ⼀组⽤于创建和测试机器学习功能的⼯具,具有与 scikit-learn 兼容的 API。
Apache Spark 中的 MLlib - Spark 中的分布式机器学习库
Hydrosphere Mist - ⼀种⽤于将 Apache Spark MLLib 机器学习模型部署为实时、批处理或反应式 Web 服务的服务。
scikit-learn - 基于 SciPy 构建的⽤于机器学习的 Python 模块。
metric-learn - ⽤于度量学习的 Python 模块。
SimpleAI Python 实现了《⼈⼯智能,⼀种现代⽅法》⼀书中描述的许多⼈⼯智能算法。它专注于提供⼀个易于使⽤、有据可查和经过测试的库。
astroML - ⽤于天⽂学的机器学习和数据挖掘。
graphlab-create - 在磁盘⽀持的 DataFrame 之上实现的具有各种机器学习模型(回归、聚类、推荐系
统、图形分析等)的库。
BigML - 联系外部服务器的库。
模式 - Python 的 Web 挖掘模块。
NuPIC - ⽤于智能计算的 Numenta 平台。
Pylearn2 - 基于 Theano 的机器学习库。 [已弃⽤]
keras - TensorFlow、CNTK 和 Theano 的⾼级神经⽹络前端。
Lasagne - 在 Theano 中构建和训练神经⽹络的轻量级库。
hebel - Python 中的 GPU 加速深度学习库。 [已弃⽤]
Chainer - 灵活的神经⽹络框架。
先知 - Facebook 的快速和⾃动化的时间序列预测框架。
gensim - ⼈类主题建模。
topik - 主题建模⼯具包。 [已弃⽤]
PyBrain - 另⼀个 Python 机器学习库。
头脑风暴 - 快速、灵活且有趣的神经⽹络。这是 PyBrain 的继承者。
Surprise - ⽤于构建和分析推荐系统的 scikit。
隐式 - 隐式数据集的快速 Python 协作过滤。
LightFM - ⽤于隐式和显式反馈的许多流⾏推荐算法的 Python 实现。
Crab - 灵活、快速的推荐引擎。 [已弃⽤]
python-recsys - ⽤于实现推荐系统的 Python 库。
思考贝叶斯 - 关于贝叶斯分析的书。
Image-to-Image Translation with Conditional Adversarial Networks - 从 isola 等⼈的论⽂中实现图像到图像 (pix2pix) 转换。[深度学习]
受限玻尔兹曼机 - Python 中的受限玻尔兹曼机。 【深度学习】
Bolt - Bolt 在线学习⼯具箱。 [已弃⽤]
CoverTree - 覆盖树的 Python 实现,⼏乎直接替代 scipy.spatial.kdtree [已弃⽤]
nilearn - Python 中神经成像的机器学习。
Neuropredict - 针对新⼿机器学习者和⾮专家程序员,该软件包在 Python 中为 NeuroImaging 和任何其他类型的功能提供简单(⽆需编码)和全⾯的机器学习(评估和预测性能的完整报告,⽆需您编写代码) .这旨在吸收⼤部分 ML ⼯作流程,与 nilearn 和 pymvpa 等其他软件包不同,它们要求您学习它们的 API 和代码以⽣成任何有⽤的东西。
不平衡学习 - 使⽤各种技术执⾏⽋采样和过采样的 Python 模块。
Shogun -Shogun 机器学习⼯具箱。
Pyevolve - 遗传算法框架。 [已弃⽤]
Caffe - ⼀个深度学习框架,在开发时考虑到了清洁度、可读性和速度。
breze - 基于 Theano 的深度和循环神经⽹络库。
Cortex - ⽤于在⽣产中部署机器学习模型的开源平台。
pyhsmm - ⽤于贝叶斯隐马尔可夫模型 (HMM) 和显式持续时间隐半马尔可夫模型 (HSMM) 中的近似⽆监督推理的库,侧重于贝叶斯⾮参数扩展、HDP-HMM 和 HDP-HSMM,主要具有弱极限近似.
SKLL - scikit-learn 的包装器,使进⾏实验变得更简单。
神经实验室
Spearmint - Spearmint 是根据论⽂中概述的算法执⾏贝叶斯优化的包:机器学习算法的实⽤贝叶斯优化. Jasper Snoek、Hugo Larochelle 和 Ryan P. Adams。神经信息处理系统的进展,2012 年。 [已弃⽤]
Pebl - 贝叶斯学习的 Python 环境。 [已弃⽤]
Theano - 在 Python 中优化 GPU 元编程代码⽣成⾯向数组的优化数学编译器。
TensorFlow - 使⽤数据流图进⾏数值计算的开源软件库。
pomegranate - Python 的隐藏马尔可夫模型,在 Cython 中实现以提⾼速度和效率。
python-timbl - 包装完整 TiMBL C++ 编程接⼝的 Python 扩展模块。 Timbl 是⼀个精⼼设计的 k-最近邻机器学习⼯具包。
deap - 进化算法框架。
pydeep - Python 中的深度学习。 [已弃⽤]
mlxtend - ⼀个包含⽤于数据科学和机器学习任务的有⽤⼯具的库。
neon - Nervana 的⾼性能基于 Python 的深度学习框架 [DEEP LEARNING]。 [已弃⽤]
Optunity - ⼀个专门⽤于⾃动超参数优化的库,具有简单、轻量级的 API 以促进⽹格搜索的插⼊替换。
神经⽹络和深度学习 - 我的书“神经⽹络和深度学习”[深度学习] 的代码⽰例。
Annoy - 近似最近邻实现。
TPOT - 使⽤遗传编程⾃动创建和优化机器学习管道的⼯具。将其视为您的个⼈数据科学助⼿,将机器学习中乏味的部分⾃动化。
pgmpy ⽤于处理概率图形模型的 Python 库。
DIGITS - 深度学习 GPU 训练系统 (DIGITS) 是⼀个⽤于训练深度学习模型的 Web 应⽤程序。
Orange - ⾯向新⼿和专家的开源数据可视化和数据分析。
MXNet - 轻量级、便携、灵活的分布式/移动深度学习,具有动态、变异感知数据流调度器;适⽤于 Python、R、Julia、Go、Javascript 等。
Milk - 专注于监督分类的机器学习⼯具包。 [已弃⽤]
TFLearn - 深度学习库,具有更⾼级别的 TensorFlow API。
REP - 基于 IPython 的环境,⽤于以⼀致和可重复的⽅式进⾏数据驱动的研究。 REP 并不试图替代 scikit-learn,⽽是对其进⾏扩展并提供更好的⽤户体验。 [已弃⽤]
rgf_python - 正则化贪婪森林(树)库的 Python 绑定。
skbayes - 使⽤ scikit-learn API 进⾏贝叶斯机器学习的 Python 包。
fuku-ml - 简单的机器学习库,包括感知器、回归、⽀持向量机、决策树等,易于使⽤,适合初学者学
习。
Xcessiv - 基于 Web 的应⽤程序,⽤于快速、可扩展和⾃动化的超参数调整和堆叠集成。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。