请选择 进入手机版 | 继续访问电脑版

HTML5星空

Spark:我AI,我真AI!

[复制链接]
发表于 2020-6-28 18:24:56 | 显示全部楼层 |阅读模式

点击“飞总聊IT”,选择“星标”

后台回复“666”领取资料一份



大数据发展到今天,估计谁都知道Spark是什么了。说真的,看到Spark一点一点的状态,逐渐取代MapReduce成为新一代大数据的计算引擎的核心,每个做大数据的人都有一点点感慨。


马上一年一度的Spark Summit又要开了。Spark 3.0也出来了,这貌似是一个满世界做数据人的盛会,毕竟神兵利器的升级,无数人的聚合,无疑都是一场喜庆。


但是不知道大家有没有注意到,Spark Summit早几年就改名Spark+AI summit了。今年当然也是少不了的。这是一个非常有意思的现象。简单来说,Spark在不遗余力的告诉整个社区,我AI,我AI,我真的AI。而Databricks则不遗余力的告诉全世界,咱们也是一个AI公司。


与之对应的,我想Spark从来都没有不遗余力的告诉大家,俺是一个大数据计算工具,Databricks也不需要努力去强调说自己是个大数据公司。你说这是为什么呢?


如果我们仔细去看看谁拿Spark用的最开心,Databricks和其他的所有提供Spark云服务的人对哪些场景最赚钱。那么毫无疑问的都指向了一件事情:ETL。甚至于很多其他数据库或者数据仓库产品对Spark的整合,其侧重点,也是ETL。


但是ETL是不是AI呢?我想很多人肯定会说不是。ETL是不是大数据呢?这个回答就会比较有意思一点,ETL肯定是大数据的重要组成部分。


而ETL是最赚钱的?为什么呢?因为刚需。


当然,ETL以外其他的事情,Spark能不能干,很多也能干。比如说,Databricks主推的开源项目Koalas,用来取代Python下常见的Pandas,社区不亦乐乎,也有很多人喜欢。但是好像比起ETL来,总是有人喜欢用Spark有人不喜欢用。不像ETL的时候,大部分人一致的选项就是Spark。


但是这个事情最有意思的在于,无论是Spark还是Databricks,其实都不急着告诉大家自己是大数据产品,是大数据公司,但却很着急的告诉大家自己是AI产品,自己是AI公司。


这说明什么呢?简单来说,大数据这个东西,不管怎么样赚钱与否,是否得到实惠,无助于挺高产品形象公司形象参考一下Cloudera估计就知道了。所以无论如何,有关自己是不是AI需要大声喊出来,也必须大声喊出来。这是和大数据不一样的地方。


只不过对于做大数据的人来说,很多人心里根深蒂固的还是会认为,Spark取代MapReduce实际上就是大数据计算的升级。不管怎么宣传,很多人还是把Spark归类于大数据工具,Databricks归类于大数据公司。但是这不妨碍Databricks自己的宣传,不妨碍Spark Summit变成Spark+AI的Summit。


总之,Databricks在AI公司的道路上一骑绝尘,谁也无法阻挡了。



推荐Python大数据人工智能
学习Python大数据人工智能的好地方

飞总聊IT,互联网最新最全的知识和信息的汇聚地每天给大家提供互联网的干货。粉丝可以发送“666”到后台领取一份学习资料。


扫描二维码加飞总微信号




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

更多资源及Java+大数据个人原创视频,
可关注本站官方公众号观看:
快讯

     京ICP备14042305号

html5star team © 2012-2013 html5星空 Comsenz Inc.

GMT+8, 2020-7-12 04:37 , Processed in 0.217919 second(s), 36 queries .

快速回复 返回顶部 返回列表