皇冠官方网站, 

10款人工智能和机械和工具学习园地点面包车型客车开源项目。
GraphLab
GraphLab是1种新的面向机器学习的并行框架。GraphLab提供了3个完好的平台,让部门得以行使可扩张的机器学习系统建立大数额以分析产品,该集团客户包蕴Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它们从其余应用程序只怕服务中抓取数据,通过推荐系统、欺诈监测系统、心境及社交网络分析系统等种类情势将大数据理念转换为生产环境下能够运用的预测应用程序。(
详情 )
品种主页: http://graphlab.org/
  
Vowpal Wabbit
Vowpal Wabbit (法斯特 Online
Learning)最初是由雅虎研究院建设的1个机器学习平台,方今该类型在微软商讨院。它是由约翰Langford运转并主导的花色。
体系地址: http://hunch.net/~vw/
  
scikits.learn
scikit-learn是三个开源的、构建在SciPy之上用于机器学习的 Python
模块。它总结容易而敏捷的工具,可用于数据挖掘和数据解析,适合于任哪个人,可在各样境况下重复使用、构建在
NumPy、SciPy和 matplotlib 之上,遵从BSD 协议。( 详情 )
花色地址: http://scikit-learn.org/stable
  
Theano
Theano是二个python库,用来定义、优化和模仿数学表明式总括,用于高效的缓解多维数组的盘算难点。它使得写深度学习模型特别简单,同时也交由了某些有关在GPU上陶冶它们的选项。(
详情 )
品种地址: http://deeplearning.net/software/theano/
  
Mahout
Mahout 是 Apache Software Foundation(ASF)
旗下的1个开源项目,提供部分可扩展的机器学习园地经典算法的兑现,旨在救助开发人士特别方便迅速地开创智能应用程序。Mahout包涵众多贯彻,包罗聚类、分类、推荐过滤、频仍子项挖掘。其余,通过使用
Apache Hadoop 库,Mahout 能够使得地扩大到云中。
体系主页: http://mahout.apache.org/
  
pybrain
pybrain是Python的三个机器学习模块,它的靶子是为机械学习任务提供灵活、易应、强大的机器学习算法。pybrain包涵神经互联网、强化学习(及两岸组合)、无监察和控制学习、进化算法。以神经网络为中央,全体的陶冶方法都是神经网络为二个实例。
花色主页: http://pybrain.org/
  
OpenCV
OpenCV是二个依照(开源)发行的跨平台总计机视觉库,可以运作在Linux、Windows和Mac
OS操作系统上。它轻量级而且神速——由一多级 C 函数和少量 C++
类构成,同时提供了Python、Ruby、MATLAB等语言的接口,达成了图像处理和计算机视觉方面包车型大巴不在少数通用算法。(
详情 )
体系主页: http://opencv.org/
  
Orange
Orange
是多少个基于组件的数目挖掘和机器学习软件套装,它的效应即友好,又很强劲,快速而又多职能的可视化编制程序前端,以便浏览数据解析和可视化,基绑定了
Python以实行脚本开发。它含有了总体的一名目繁多的组件以开始展览数据预处理,并提供了多少账面,过渡,建立模型,情势评估和勘探的效能。
项目主页: http://orange.biolab.si/
  
NLTK
NLTK(natural language
toolkit)是python的自然语言处理工具包。200一年推出,到现在发展越发活跃。它的最首要功效是为了教学,于今已经在20二国60多所大学使用,里面蕴涵了汪洋的词料库,以及自然语言处理方面包车型大巴算法完结:分词,
词根总计, 分类, 语义分析等。
项目主页: http://nltk.org/
  
Nupic
Nupic是三个开源的人为智能平台。该品种由Grok(原名
Numenta)公司支出,个中囊括了铺面的算法和软件架构。 NuPIC
的运作接近于人脑,“当情势转变的时候,它会忘记旧情势,回忆新方式”。如人脑壹样,CLA
算法能够适应新的扭转。( 详情 )
品种主页: http://numenta.org/nupic.html
  

 

皇冠官方网站 1
图为IBM大数额与分析事业部整个世界研究开发副CEODinesh Nirmal。

 

当年是Shakespeare逝世肆百周年。在莎翁名剧《Julius·凯撒》中一个六柱预测师有如此一句未有上下文的预知:“请小心‘十二月’中”,
凯撒听后不亮堂这句话是何意思,于是说让那么些看相师继续做梦吧。结果在4月⑩2四日,凯撒被密谋暗杀。类似的,后天的前瞻算法能够告知您三个预知,但却不知道该如何做提供适当的上下文,那令人难以做出尤其行动的核定。

 

另一个有关预估测计算法的例证是在风行的《复仇者缔盟三》中,出现了一人造智能合成物“奥创”。奥创只可以按字面掌握任务,于是把“拯救地球”掌握成了“杀死全体的人类”。那就好像三个特出的预总括法,按字面驾驭职务而忽视掉了别的的大概或任务的现实意义。

 

于是,201六年八月,印度孟买理工科商院教书迈克尔 Luca、法学教师Sendhil
Mullainathan以及康奈尔大学教学JonKleinberg联合在《加州圣巴巴拉分校经济贸易评论》宣布了1篇题为《算法也急需管家》的作品,呼吁满世界科学和技术界和商产业界在机器学习算法和人工智能时期要注意算法的管理难题。因为,若是有壹天,算法能够支配“凯撒”或地球的天命,那么何人来管理算法呢?

 

IBM大数目与分析事业部满世界研究开发副总经理Dinesh
Nirmal近来出现在京都进行的201陆机械学习和行业利用国际高峰会议,他介绍了IBM作为满世界大数量解析、机器学习和人工智能的前线科学和技术公司将怎么样面对三个复杂的算法世界,那就为机械学习造四个方可自学习、自调整、自优化的机器管家——基于斯Parker的机械学习云服务。

 

Apache
斯Parker是3个分布式计算框架,是专为满足低顺延任务和内存数据存款和储蓄而优化的开源大数据系统。由于其并行计算品质以及专职速度、可扩大性、内部存款和储蓄器处理以及容错性等,再拉长可小幅简化编制程序的丰硕API,让Spark成为了机器学习算法的主流计算平台。IBM在20一五年7月文告进入斯Parker开源社区,并许诺将把斯Parker作为本人的解析与商务平台宗旨。

15 个开源的一等人工智能工具

201陆年13月尾始,IBM花了七个月时间支付了遵照斯Parker的机械学习云服务,该云服务将提供公有云、本地安插及混合云布置等版本,该云服务还可配置在IBM大型主机z连串上。Dinesh强调,该云服务除此之外在获取数据、抽取特征、磨练模型、安插模型、做出预测等经典机器学习进程中实行优化外,还出席了源源反馈、自动建立模型、重新磨炼模型等自动化管理。

 

 

人工智能artificial
intelligence,AI是科技(science and technology)探究中最紧俏的动向之一。像
IBM、谷歌(谷歌(Google))、微软、Facebook和亚马逊等公司都在研究开发上投入大批量的工本、只怕收买那个在机器学习、神经网络、自然语言和图像处理等世界取得了开始展览的初创集团。考虑到人们对此感兴趣的档次,大家将不会惊叹于俄亥俄州立的专家在人为智能报告中汲取的下结论:“更加强大的人造智能应用,可能会对咱们的社会和经济产生深入的积极性影响,那将现出在以前几天到
2030 年的年华段里。”

在前不久的一篇文章中,大家概述了
4多少个分外幽默或有前途的人工智能项目。在本文中,大家将聚焦于开源的人为智能工具,详细的掌握下最资深的
一伍 个开源人工智能项目。

以下那个开源人工智能应用都远在人工智能商量的超过。

在机动建立模型中,IBM的机器学习云服务能够基于数据模型自动推荐最优算法,并依据数据特征值来评论模型的习性和展现,当模型磨练好后可在实时环境、生产条件和离线批量环境中配备模型。当数码变动后,该云服务仍是能够实时监察和控制模型的变现,然后自动重新兵练习练模型。整个经过中不须求把模型离线磨炼后再重复上线,非常的大便利了实时生产环境中的商业利用。

1. Caffe

皇冠官方网站 2

它是由贾扬清在加州大学伯克利分校的读博时创设的,Caffe 是3个基于表明种类布局和可增添代码的纵深学习框架。使它声名鹊起的是它的快慢,那让它受到切磋人口和合营社用户的迎接。依据其网址所言,它能够在一天之内只用七个NVIDIA K40 GPU 处理 陆仟万八个图像。它是由Berkeley视野和读书为主(BVLC)管理的,并且由 NVIDIA
和亚马逊等公司接济来协理它的开拓进取。

Dinesh认为,在机械学习的世界里,开源是三个大趋势。为此,IBM开源了和谐的重量级机器学习框架SystemML,并在华盛顿实行斯Parker技术大旨,还在大地投入当先3500名IBM研究和开发人士开展与斯Parker相关项目。2016年10月,IBM把团结的开源软件与基于Apache
斯Parker的H贰O、XC60Studio、Jupyter
Notebooks等开源科研分析交互环境相结合推出了Data Science
Experience云服务,以升级数据化学家的机械学习和数码解析速度。

2. CNTK

皇冠官方网站 3

它是一个钱打二十五个结互连网工具包Computational Network
Toolkit的缩写,CNTK 是二个微软的开源人工智能工具。不论是在单个
CPU、单个 GPU、多个 GPU 或是拥有三个 GPU
的多台机器上它都有绝妙的显示。微软重大用它做语音识别的研商,不过它在机械翻译、图像识别、图像字幕、文本处理、语言了然和语言建立模型方面都有着好好的运用。

为了尤其增强协调的多寡解析产品和技能生态圈,IBM从20一5的话为Apache
Toree、EclairJS、Apache Quarks、Apache Mesos、Apache
塔赫yon(现更名称为Alluxio)等开源项目做了汪洋贡献,也为Apache
斯Parker的子项目如斯ParkerSQL、Spark奥德赛、MLLib和Py斯Parker等做了深入进献。近来,斯Parker已经与IBM的沃特son、商务、分析、系统和云等超越4伍种基本产品相结合。

3. Deeplearning4j

皇冠官方网站 4

Deeplearning4j 是一个 Java 虚拟机(JVM)的开源深度学习库。它运转在分布式环境并且集成在Hadoop 和 Apache
Spark
 中。那使它能够配备深度神经网络,并且它与
Java、Scala 和 别的 JVM 语言兼容。

那么些类型是由三个号称 Skymind
的小买卖公司管制的,它为这些项目提供协理、培养和练习和1个小卖部的发行版。

IBM对于斯Parker的投入已经超先生过三亿日元,并把斯Parker视为数据解析的操作系统。推出基于斯Parker的机器学习云服务是IBM的最新进展,是为了给机器学习算法提供贰个安然无恙、高可相信的联合保管平台。在此基础之上,IBM进一步把沃特son用于机器学习,令人工智能扶助机器学习算法更“聪明”地通晓人的企图,那就是刚推出的沃特son数据平台。

4. DMTK

皇冠官方网站 5

DMTK 是分布式机器学习工具Distributed Machine
Learning Toolkit的缩写,和 CNTK
1样,是微软的开源人工智能工具。作为规划用来大数据的应用程序,它的对象是越来越快的磨练人工智能体系。它总结多少个非常重要组件:D高通框架、LightLDA
宗旨模型算法和分布式(多义)字嵌入算法。为了证实它的快慢,微软证明在2个捌集群的机器上,它亦可“用
十0 万个主题和 一千 万个单词的词汇表(总共 十万亿参数)练习多个主旨模型,在多个文书档案中搜集 1000亿个记号,”。那百分之十便是其余工具无法比拟的。

Dinesh介绍说IBM正在把拥有的机械学习、人工智能、数据解析、数据管理等组合起来到3个集合的依照Spark的平台上,那包罗开源的算法以及IBM自有的算法等,再通过优化和布置公司级化解方案,最后以混合云情势为公司创设二个足以自由选取的多寡与算法管理平台。

5. H20

皇冠官方网站 6

相对而言起科研,H2O 更正视将 AI 服务于集团用户,因此H贰O 装有大批量的店铺客户,比如第3资金金融公司、Cisco、Nielsen
Catalina、PayPal
和华美都以它的用户。它声称任什么人都得以选拔机械学习和展望分析的能力来缓解事情难点。它能够用来预测建立模型、风险和期骗分析、保证分析、广告技术、医疗保健和客户情报。

它有二种开源版本:标准版 H二O 和 斯Parkering 沃特er 版,它被合并在
Apache Spark 中。也有付费的店铺用户协助。

20一柒年,大家将迎来三个移动互连网大提高的大学一年级时,数据与算法将越加便于地“统治”世界。从在线音乐、在线娱乐、在线广告到各项生活服务、社交关系以及内容消费等,机器学习算法在无意中替芸芸众生做了成都百货上千取舍。由此在欢呼机器解放人类的同时,也要当心算法带来的“偏见”,那就供给能够自学习、自考订的机器。

6. Mahout

皇冠官方网站 7

它是 Apache
基金会项目,Mahout 是两个开源机器学习框架。遵照它的网址所言,它富有三个基本点的表征:1个营造可扩展算法的编程环境、像
斯Parker 和 H二O 一样的预制算法工具和1个叫 Samsara 的矢量数学实验环境。使用
Mahout 的商号有
Adobe、埃森哲咨询公司、Foursquare、英特尔、领英、推特(Twitter)、雅虎和其它过多公司。其网址列了出第二方的正儿8经补助。

从机器学习到读书的机械,那是人为智能商业化道路上的必经之路。

7. MLlib

皇冠官方网站 8

由于其速度,Apache 斯Parker成为一个最流行的大数目处理工科具。MLlib 是
斯Parker 的可扩张机器学习库。它集成了 Hadoop 并能够与 NumPy 和 酷路泽进行互动操作。它回顾了恒河沙数机械学习算法如分类、回归、决策树、推荐、集群、宗旨建立模型、作用转移、模型评价、ML
管道架构、ML
持久、生存分析、频仍项集和系列方式挖掘、分布式线性代数和计算。

【编辑推荐】

8. NuPIC

皇冠官方网站 9

由 Numenta 公司管理的 NuPIC 是2个基于分层临时回想Hierarchical
Temporal Memory,HTM理论的开源人工智能项目。从实质上讲,HTM
试图创造2个电脑类别来模拟人类大脑皮层。他们的靶子是开创四个“在很多体味职务上类似只怕当先人类认知能力” 的机械。

除此而外开源许可,Numenta 还提供 NuPic
的商业贸易许可协议,并且它还提供技术专利的许可证。

9. OpenNN

皇冠官方网站 10

用作一个为开发者和科研人士设计的持有高级通晓力的人为智能,OpenNN 是三个完成神经互联网算法的
c++
编制程序库。它的第三特性包罗深度的架构和飞跃的品质。其网址上能够查到充裕的文书档案,包蕴二个解释了神经互联网的基本知识的入门教程。OpenNN
的付费扶助由一家从事预测分析的西班牙王国(The Kingdom of Spain)公司 Artelnics 提供。

10. OpenCyc

皇冠官方网站 11

由 Cycorp
公司成本的 OpenCyc 提供了对 Cyc
知识库的拜访和常识推理引擎。它兼具抢先 23玖,000 个条目,大致 二,0九三,000
个长富组和大约 6九,000
owl:那是壹种恍若于链接到外部语义库的命名空间。它在富领域模型、语义数据集成、文本精晓、特殊领域的专家系统和游乐
AI 中有所美好的施用。该铺面还提供其它七个本子的
Cyc:一个可免费的用于科学切磋不过不开源,和一个提须求公司的然而急需付费。

11. Oryx 2

皇冠官方网站 12

构建在 Apache Spark 和 Kafka 之上的 Oryx
2
 是三个特别针对广大机器学习的应用程序开发框架。它采纳二个分化平常的叁层
λ 架构。开发者能够使用 Orys 2创设新的应用程序,此外它还有所一些预先创设的应用程序能够用于大规模的大数额职务比如协同过滤、分类、回归和聚类。大数据工具供应商
Cloudera 创造了初期的 Oryx 一 门类同时平素积极参加持续前进。

12. PredictionIO

皇冠官方网站 13

当年的五月,Salesforce
收购了 PredictionIO,接着在7月,它将该平台和商标进献给
Apache 基金会,Apache 基金会将其列为孵育安排。所以当 Salesforce 利用
PredictionIO
技术来进步它的机械学习能力时,功能将会联合出现在开源版本中。它可以扶助用户创制带有机器学习效果的前瞻引擎,那可用来布置能够实时动态查询的
Web 服务。

13. SystemML

皇冠官方网站 14

最初由 IBM 开发, SystemML 以往是贰个Apache
大数目项目。它提供了一个高度可伸缩的阳台,能够兑现高等数学生运动算,并且它的算法用
猎豹CS陆或1体系似 Python 的语法写成。公司已经在使用它来跟踪小车维修客户服务、规划机场交通和连接社会媒体数据与银行客户。它能够在
斯Parker 或 Hadoop 上运维。

14. TensorFlow

皇冠官方网站 15

TensorFlow 是多少个谷歌的开源人工智能工具。它提供了1个运用数据流图实行数值计算的库。它能够运作在两种分裂的享有单或多
CPU 和 GPU
的种类,甚至足以在活动装备上运行。它抱有抓牢的油滑、真正的可移植性、自动微分作用,并且帮忙Python 和
c++。它的网址有着分外详实的学科列表来支援开发者和切磋人口沉浸于选用或扩张他的成效。

15. Torch

皇冠官方网站 16

Torch 将团结讲述为:“三个先期选拔 GPU
的富有机器学习算法广泛协助的科学总结框架”,它的特点是看人下菜和进程。别的,它能够很简单的通过软件包用于机器学习、计算机视觉、频限信号处理、并行处理、图像、摄像、音频和互连网等方面。它借助多个名为LuaJIT 的脚本语言,而 LuaJIT 是基于 Lua 的。

转载:https://linux.cn/article-7830-1.html

 

 

 

 

 

技巧干货:人工智能和机器学习世界中有趣的开源项目

[日期:2014-12-04] 来源:驱动中国网(北京)  作者: [字体:大 中 小]

  本文简要介绍了10款
Quora上网络好友推荐的 人造智能机器学习世界方面包车型大巴开源项目。

皇冠官方网站 17

  GraphLab

  GraphLab是一种新的面向机器学习的相互框架。GraphLab提供了一个完好无缺的阳台,让单位得以应用可扩充的机械学习种类成立大数据以分析产品,该集团客户包涵Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它们从其余应用程序可能服务中抓取数据,通过引入系统、期骗监测系统、心境及社交网络分析系统等系统情势将大数据理念转换为生产条件下能够运用的预测应用程序。(
详情 )

  项目主页: http://graphlab.org/

  Vowpal Wabbit

  Vowpal Wabbit (法斯特 Online
Learning)最初是由雅虎商量院建设的三个机械学习平台,近年来该类型在微软研商院。它是由JohnLangford运转并主导的种类。

  项目地址: http://hunch[.NET](http://lib.csdn.net/base/dotnet)/~vw/

  scikits.learn

  scikit-learn是三个开源的、营造在SciPy之上用于机器学习的 Python 模块。它包涵不难而急速的工具,可用来数据挖掘和数量解析,适合于任哪个人,可在各个情状下重复使用、创设在
NumPy、SciPy和 matplotlib 之上,遵从BSD 协议。( 详情 )

  项目地址: http://scikit-learn.org/stable

  Theano

  Theano是一个python库,用来定义、优化和宪章数学表达式计算,用于高效的缓解多维数组的总括难题。它使得写纵深学习模型尤其便于,同时也交给了部分关于在GPU上练习它们的选项。(
详情 )

  项目地址:
http://deeplearning[.Net](http://lib.csdn.net/base/dotnet)/software/theano/

  Mahout

  Mahout 是 Apache Software Foundation(ASF)
旗下的一个开源项目,提供部分可扩充的机器学习世界经典算法的完成,目的在于救助开发人士尤其方便火速地创造智能应用程序。Mahout包含众多贯彻,包蕴聚类、分类、推荐过滤、频仍子项挖掘。其它,通过采用Apache Hadoop 库,Mahout
能够使得地壮大到云中。

  项目主页: http://mahout.apache.org/

  pybrain

  pybrain是Python的三个机械学习模块,它的目的是为机械学习职务提供灵活、易应、强大的机器学习算法。pybrain包含神经互连网、强化学习(及双方结合)、无监督学习、进化算法。以神经互连网为基本,全数的练习方法都是神经互联网为贰个实例。

  项目主页: http://pybrain.org/

  OpenCV

  OpenCV是三个依照(开源)发行的跨平台总括机视觉库,能够运维在Linux、Windows和Mac
OS操作系统上。它轻量级而且相当慢——由壹雨后春笋C 函数和少量 C++
类构成,同时提供了Python、Ruby、MATLAB等语言的接口,完毕了图像处理和总结机视觉方面包车型大巴多多通用算法。(
详情 )

  项目主页: http://opencv.org/

  Orange

  Orange
是四个依照组件的数码挖掘和机器学习软件套装,它的效应即友好,又很强劲,赶快而又多职能的可视化编制程序前端,以便浏览数据解析和可视化,基绑定了
Python以进行脚本开发。它含有了总体的一多级的零部件以拓展数据预处理,并提供了多少账面,过渡,建立模型,形式评估和勘探的成效。

  项目主页: http://orange.biolab.si/

  NLTK

  NLTK(natural language
toolkit)是python的自然语言处理工科具包。200一年出产,现今发展尤其活跃。它的重点功能是为着教学,至今已经在20多个国家60多所大学使用,里面包含了大批量的词料库,以及自然语言处理方面包车型大巴算法完结:分词,
词根计算, 分类, 语义分析等。

  项目主页: http://nltk.org/

  Nupic

  Nupic是1个开源的人工智能平台。该品种由Grok(原名
Numenta)公司支付,在那之中囊括了公司的算法和软件架构
NuPIC
的运营接近于人脑,“当情势转变的时候,它会忘记旧情势,记念新格局”。如人脑1样,CLA
算法能够适应新的变型。( 详情 )

  项目主页: http://numenta.org/nupic.html

  以上是作者整理的10款人工智能和机械学习园地的开源项目。越来越多花色可参考这几个列表:
http://deeplearning.net/software\_links/

相关文章