知乎开源机器学习_开源机器学习⼊门
知乎 开源机器学习
尽管所有头条新闻都将被来⾃天空的杀⼿级机器⼈在我们眼前的凡⼈⾝上拜访,但机器学习和⼈⼯智能仍然存在。 更重要的是,机器学习(ML)Swift成为开发⼈员增强其应⽤程序和职业,更好地理解数据并帮助⽤户提⾼效率的⼀项关键技能。
什么是机器学习? 它是使⽤历史数据和当前数据来进⾏预测,组织内容和学习有关数据的模式,⽽⽆需进⾏明确的编程。 通常使⽤统计技术来完成此任务,该技术会查数据中的重要事件(例如共现和异常),然后将其可能性考虑进⼀个模型中,稍后再查询该模型以提供⼀些新数据的预测。
常见的机器学习任务包括分类(对项⽬应⽤标签),聚类(⾃动对项⽬进⾏分组)和主题检测。 它也常⽤于⾃然语⾔处理。 机器学习正越来越⼴泛地⽤于各种⽤例中,包括内容推荐,欺诈检测,图像分析和电⼦商务。 它在许多⾏业中都⾮常有⽤,并且⼤多数流⾏的编程语⾔都⾄少具有⼀个实现常⽤ML技术的开源库。
反映了软件向开放源代码的⼴泛推动,现在可以使⽤许多充满活⼒的机器学习项⽬进⾏实验,并提供⼤量书籍,⽂章,教程和视频,以帮助您快速⼊门。 让我们看⼀些引领开源机器学习的⽅法的项⽬,以及有关ML术语和技术的⼀些⼊门。
uview底漆
除了项⽬主页和⽂档之外,还有许多极好的资源可⽤来教授机器学习背后的核⼼概念。 尽管有成百上千(甚⾄成千上万)有关ML的书籍和教程,但我尝试着重于针对程序员的书籍和教程,⽽不再着重于过于严格或过于关注幕后数学的书籍和教程。 尽管从长远来看,这些东西很重要,但通常会妨碍⼯程师在⼊门阶段尝试使⽤实际数据的实际系统。
1.  Toby Segaran撰写的是利⽤机器学习思想构建Web应⽤程序的最佳介绍之⼀。 通过使⽤Python中的⽰例,Segaran提出了许多常
⽤⽅法背后的概念,这些⽅法可以利⽤先前的历史为将来带来收益。
2. Joel Grus撰写的 。 数据科学的另⼀个基于Python的介绍,将带您进⼊线性代数,统计和概率(但不要太多!)等核⼼原理,然后再
进⼊机器学习的基⽯:回归,神经⽹络和 。
3. Andrew Ng)的 。 从许多⽅⾯讲,吴先⽣⾸先在iTunes上进⾏演讲,现在通过Coursera进⾏培训,他是机器学习⽅⾯的领先教育
者。 请预先警告:本课程需要投⼊,但是值得您深⼊了解该主题。
4.  Foster Provost和Tom Fawcett的的知识。 引⽤序⾔:“这不是⼀本有关算法的书,也不是⼀本有关算法的书的替代品。我们故意
python入门教程视屏
避免使⽤以算法为中⼼的⽅法。我们认为,作为技术基础的基本概念或原则相对较少这些概念为许多众所周知的数据挖掘算法奠定了基础。”
5. 希拉⾥·梅森(Hilary Mason)对 。 Mason和O'Reilly Media制作的这个视频系列是⼀个易于理解的相对较短的视频集,向您介绍
了机器学习中的关键主题,例如聚类和分类。
专案
尽管有许多出⾊的开源机器学习项⽬,但以下项⽬结合了强⼤的技术能⼒,良好的⽂档和可访问的社区,⽤于提出问题和解决问题。
威卡
来⾃新西兰怀卡托⼤学的长期以来为开源机器学习树⽴了标准,它具有丰富的⼯具集,⼤量的算法可供试⽤,以及⽤于探索数据和结果的⽤户界⾯。 它也有⼀本出⾊的随 ,其中解释了许多ML概念,同
时显⽰了使⽤Weka的⽰例。 虽然不⼀定要顺应最新的深度学习热潮,但这是⼀个坚实的项⽬,可以开始理解这些概念。
马豪
作为该项⽬的联合创始⼈,我⼏乎不屑⼀顾, 在过去的⼀年中对其进⾏了重新设计,以专注于Apache Spark以及在交付常⽤的ML算法的实现时全⾯检查构建ML模型的⽅式。 对于仍在使⽤Hadoop MapReduce的⽤户,Mahout继续使⽤MapReduce范式维护⽤于分类,聚类和建议的关键算法的实现。
Spark的MLLIb
计算机二级c语言一个月可以过吗
从Apache Spark的天开始构建,致⼒于以可扩展的⽅式提供⽤于集和分类的常⽤机器学习算法。 通过利⽤Spark,MLLIb能够利⽤⼤规模集优化来处理⼤数据,这在机器学习中尤其重要,因为所使⽤的许多算法本质上都是迭代的,⽽且数据量⼤。
Scikit学习
建⽴在其他可靠的Python库(例如NumPy和SciPy)上,将上述Java / Scala库中涵盖的许多算法和⼯具引⼊了Python堆栈。 添加⼀组不错的 ,您将拥有⼀个图书馆,可以⽴即让您学习和学习。
深度学习4J
借助ML流⾏词领域中的最新流⾏词开源带来了⼀组强⼤的算法,这些算法旨在在Hadoop和Spark上进⾏单机和分布式深度学习。 它具有⽤于处理数据的⼀系列实⽤程序,还具有GPU(图形处理单元)⽀持。
个人网站题材
什么是深度学习? 深度学习已在Google,Facebook和Amazon等地⽅越来越多地使⽤,它是⼀种新的⼤规模神经⽹络⽅法,旨在显着减少训练和维护模型所需的⼈⼯⼲预,同时还提供明显更好的结果。 所谓的DL4J在亚当·吉布森(Adam Gibson)和乔什·帕特森(Josh Patterson)的著作中也有⼀本书( )。
05网语文奖励项⽬
使用git克隆代码的命令与所有概述⽂章⼀样,根本没有⾜够的空间来覆盖⼀个空间中的所有重要项⽬,因此请确保还检查 , , 以及开源机器学习库的 。
下⼀步
机器学习⼊门的真正关键是从上述项⽬之⼀下载⼀些⽰例数据和代码。 探索不同的⽅法时,请做好准备进⾏⼤量的试验和错误。 您将很快发现,尽管对⼈⼯智能进⾏了⼤肆宣传,但构建这些应⽤程序仍
然需要⼤量的⼈⼯智能才能获得良好的结果。
阿帕奇
鹅⽑笔
知乎 开源机器学习

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。