选自sas,英文原文:http://blogs.sas.com/content/subconsciousmusings/2017/04/12/machine-learning-algorithm-use/机器之心编译
参与:黄小天、蒋思源、吴攀
本文主要的目标读者是机器学习爱好者或数据科学的初学者,以及对学习和应用机……继续阅读 »
丁火
8年前 (2017-05-28) 3320浏览 0评论
0个赞
GPU是替代不了CPU的,同样,CPU也替代不了GPU。如果形象点理解,GPU就像一群蚂蚁,这些蚂蚁都做着同样的事,而CPU就像一只猴子,这只猴子做着各种不同的事。
从根本上说CPU和GPU它们的目的不同,且有不同侧重点,也有着不同的性能特性,在某些工作中CPU执行得更快,另一工作中或许GPU能更好。当你需要对大量数据做同样的事情时,GPU更合适,当你需要……继续阅读 »
丁火
8年前 (2017-03-27) 1817浏览 0评论
0个赞
PS:最近测试一套比较新的开源ERP,对系统软件版本要求很新,CentOS7也没这么新的开发包,也不喜欢编译安装(洁癖)。想起了Fedora来,之前有台测试机Fedora22,就想把它更新到最新的Fedora24。该版本glibc 更新到2.23,GCC编译器更新到6.1了,够新!折腾了下,跨版本升级成功。注意:此操作只合适开发和测试环境,不能在生产环境这样……继续阅读 »
丁火
8年前 (2016-08-24) 2924浏览 4评论
0个赞
PS:机器学习这两年特别火,ATB使劲开百万到几百万年薪招美国牛校的机器学习方向博士,作为一个技术控,也得折腾下,就这样来初步折腾下Mahout这个机器学习的主流开源框架。
一、Mahout简介
查了Mahout的中文意思:驭象的人,再看看Mahout的logo,骑在象头上的那个Mahout。机器学习是人工智能的一个分支,它涉及通过一些技术来允许计算机根据之……继续阅读 »
丁火
9年前 (2016-07-20) 3277浏览 3评论
0个赞
大数据通用处理平台
Spark
Flink
Hadoop
分布式存储
HDFS
资源调度
Yarn
Mesos
机器学习工具
Mahout
Spark Mlib
TensorFlow (Google 系)
Amazon Machine Learning
DMTK (微软分布式机器学习工具)
数据分析/数据仓库(SQL类)
Pig
Hive
kyl……继续阅读 »
丁火
9年前 (2016-06-15) 11723浏览 1评论
0个赞
随着大数据越来越被重视,数据采集的挑战变的尤为突出。今天为大家介绍几款数据采集平台:
Apache Flume
Fluentd
Logstash
Chukwa
Scribe
Splunk Forwarder
大数据平台与数据采集
任何完整的大数据平台,一般包括以下的几个过程:
数据采集
数据存储
数据处理
数据展现(可视化,报表和监控)
其中,数……继续阅读 »
丁火
9年前 (2016-05-24) 6189浏览 0评论
0个赞
在当前的互联网领域,大数据的应用已经十分广泛,尤其以企业为主,企业成为大数据应用的主体。大数据真能改变企业的运作方式吗?答案毋庸置疑是肯定的。随着企业开始利用大数据,我们每天都会看到大数据新的奇妙的应用,帮助人们真正从中获益。大数据的应用已广泛深入我们生活的方方面面,涵盖医疗、交通、金融、教育、体育、零售等各行各业。
目前国内外做大数据的厂商依旧分为两类:……继续阅读 »
丁火
9年前 (2016-05-16) 3756浏览 0评论
0个赞
MySQL
MySQL Connector/J Driver
驱动程序包名:MySQL-connector-Java-x.x.xx-bin.jar
驱动程序类名: com.mysql.jdbc.Driver
JDBC URL: jdbc:mysql://<host>:<port>/<database_name>
默认端口3……继续阅读 »
丁火
9年前 (2016-05-03) 2625浏览 0评论
0个赞
PS:本人所在的公司使用OpenStack核心开发的私有云也有3年多时间了,感觉比较可惜的是2012年年底做私有云技术选型时部署测试过的CloudStack(以前折腾CloudStack的记录在http://www.macd11.com/index.php?s=CloudStack),现在发现其中国社区网站已经关闭了,也看到今天大公司越来越多基于Openst……继续阅读 »
丁火
9年前 (2016-05-02) 3152浏览 0评论
0个赞
现在机器学习逐渐成为行业热门,经过20多年的发展,机器学习目前也有了十分广泛的应用,如:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、DNA序列测序、语音和手写识别、战略游戏和机器人等方面。
云栖社区特意翻译整理了目前GitHub上最受欢迎的28款机器学习开源项目,以供开发者参考使用。
1. TensorFlow
TensorFl……继续阅读 »
丁火
9年前 (2016-05-02) 2313浏览 0评论
0个赞
虽然此前已经多次提及,但在这里我要再次强调2015年作为云计算全面崛起元年的重要地位,这在很大程度上是因为这一年内出现了众多值得高度关注的大事件——包括戴尔/EMC的合并,而这些标志性事件意味着新的时代已然来临。这是一种直白而决绝的表态,意味着全部传统IT厂商都需要努力争取自己的生存空间,否则必将为历史所淘汰。
这场演进或者说革命则让OpenStack处于非……继续阅读 »
丁火
9年前 (2016-01-06) 2903浏览 0评论
0个赞