CTI論壇(ctiforum)7月23日消息(記者 李文杰):在12月12-14日北京召開的 BDTC 2014上,Hadoop 之父、Cloudera 首席架構師 Doug Cutting,OpenStack 基金會董事杜玉杰,Spark 發(fā)源公司 Databricks 軟件工程師孟祥瑞都將參與分享。
從2008年僅60人參加的技術沙龍到當下的數千人技術盛宴,作為業(yè)內極具實戰(zhàn)價值的專業(yè)交流平臺,已經成功舉辦七屆的中國大數據技術大會忠實地描繪了大數據領域內的技術熱點,沉淀了行業(yè)實戰(zhàn)經驗,見證了整個大數據生態(tài)圈技術的發(fā)展與演變。
2014中國大數據技術大會(BDTC)將如約在京召開
12月12-14日,由中國計算機學會(CCF)主辦,CCF 大數據專家委員會承辦,中國科學院計算技術研究所與 CSDN 共同協(xié)辦的2014中國大數據技術大會(Big Data Technology Conference 2014,BDTC 2014)將在北京新云南皇冠假日酒店如約召開。大會前夕,我們從議題角度總結了今年 BDTC 不可錯過的十大理由。
理由一:深度的產業(yè)現(xiàn)狀與趨勢解讀。中國計算機學會將在 BDTC 2014上正式發(fā)布《2015大數據十大發(fā)展趨勢預測》與《中國大數據技術與產業(yè)發(fā)展白皮書(2014)》。上屆大會 -- BDTC 2013 上發(fā)布的兩份報告得到了學術界和產業(yè)界的高度關注。今年,在大數據的產學研用繼續(xù)深化更加務實之時,由百余位技術專家參與的《2015大數據十大發(fā)展趨勢預測》以及涵蓋大數據發(fā)展背景、大數據典型應用現(xiàn)狀、大數據技術體系現(xiàn)狀、大數據 IT 產業(yè)鏈與生態(tài)環(huán)境、大數據人才資源、大數據發(fā)展趨勢與建議等多個篇章的《中國大數據技術與產業(yè)發(fā)展白皮書(2014)》,更加值得期待。除此之外,BDTC 2014還設有多場對行業(yè)趨勢的預測和解讀,其中包括星環(huán)科技 CTO 孫元浩分享的《2015年大數據基礎技術的演進趨勢》與武漢綠色網絡信息服務有限責任公司副總經理雷葆華帶來的《大數據時代的網絡基礎設施演進》等。
理由二:頂尖的行業(yè)應用分享。歷經數年發(fā)展,大數據已愈加成熟,并在制造、交通、醫(yī)療、教育、金融等行業(yè)中得到了深入應用。為此本屆大會將展開多場對行業(yè)應用的探討,其中包括,中國聯(lián)通千人計劃引進人才,華盛頓大學副教授陳一昕的《電信運營商大數據應用實踐》,中國移動蘇州研發(fā)中心大數據產品部總經理錢嶺的《電信運營商大數據商務模式研究》,萬向集團通聯(lián)數據首席戰(zhàn)略官龍白滔的《金融大數據的分析和挖掘》,高德技術專家周琦的《大數據在實時交通信息中的應用》等。
理由三:國際前沿的學術研究成果。在技術分享之外,2014年第二屆 CCF 大數據學術會議也將同時召開,并與技術大會共享主題報告。屆時,Conviva 聯(lián)合創(chuàng)始人兼 CEO、卡耐基梅隆大學計算機科學系教授張暉,特拉華大學電子與計算機工程系教授、計算機系統(tǒng)結構和并行系統(tǒng)實驗室創(chuàng)始人暨主任高光榮,ICML 2014程序委員會主席、卡耐基梅隆大學教授 Eric P. Xing 都將出席本次盛會,為大家分享國際最前沿的大數據技術研究成果。
理由四:來自 Hadoop 生態(tài)圈的豪華陣容。回顧 Hadoop 歷史,該項目在2006年初雅虎聘請 Doug Cutting 后才正式脫離 Nutch 項目,到2008年也才剛剛成型。但是,就在2008年底,大會組委會即投入精力到 Hadoop 的布道,雖然規(guī)模只有數十人,邀請的專家卻涵蓋雅虎、Facebook、百度等公司的核心技術人員。時至今日,Hadoop 已被業(yè)內公認為大數據的核心技術,分布式環(huán)境下提供海量數據處理能力的事實標準。而本屆會議,我們更邀請到了 Hadoop 之父、Cloudera 首席架構師 Doug Cutting,Hortonworks 核心技術人員 Ted Yu,Apache Hadoop committer、PMC 成員Uma Maheswara Rao G,Apache Hadoop Committer Yi Liu,Apache Hadoop 和 Tez 項目 PMC 成員 Bikas Saha 等多位知名 Hadoop 專家,帶大家領略 Hadoop 生態(tài)圈最新的研發(fā)成果和發(fā)展趨勢。
理由五:Databricks:了解源于 Spark 的初創(chuàng)公司在做什么。Spark 發(fā)源于美國加州大學伯克利分校 AMPLab 的集群計算平臺,立足于內存計算,在與 Hadoop 生態(tài)圈兼容的情況下,提供了近實時的數據處理能力。在短短4年時間,Spark 已發(fā)展為 Apache 軟件基金會的頂級開源項目,擁有30個 Committer,其用戶包括 IBM、Amazon、Yahoo!、Sohu、百度、阿里、騰訊等多家國內外公司,更包括了 Spark SQL、Spark Streaming、Mllib、GraphX 等多個相關項目。然而,這個新貴的步伐顯然不止于實時計算,在近日 Sort Benchmark 公布的海量(100TB)離線數據排序結果上,Spark 已經接手了老將 Hadoop 的冠軍寶座,而在不久前更終止了 Shark 項目,并開啟了全新的 Spark SQL。那么 Spark 今后的 RoadMap 又將是什么,這里我們不妨看向本屆會議上 Databricks 軟件工程師孟祥瑞的分享 -- 《Spark and Databricks Cloud》。同時,在分享結束后,你還有機會向孟祥瑞單獨請教。
理由六:百度、騰訊分享的深度學習探索。近年來,各大互聯(lián)網公司對機器學習的投入是越來越高,也間接造成了當下神經網絡和深度學習領域的火爆。在 BDTC 2014上,百度和騰訊將分享各自在深度學習領域的最佳實踐 -- 《百度深度學習探索》與《Mariana:騰訊深度學習平臺的進展和應用》。
理由七:一網打盡各個領域國內外眾多機構的大數據實戰(zhàn)。大數據時代給人們帶來了數不盡的機會,然而想利用大數據取勝卻并不是件容易的事情,企業(yè)往往需要克服海量數據存儲、處理、安全等方面的眾多挑戰(zhàn)。為了迎接大數據時代的到來,進一步推進大數據技術創(chuàng)新與應用,本屆會議將放出大量知名機構的最佳實踐經驗,其中包括:LinkedIn 軟件工程師王國璋的《Apache Kafka 解析及其 LinkedIn 的應用實踐》,Dropbox 技術經理邵錚的《Dropbox 大數據應用》,百度核心技術專家的《百度集群管理系統(tǒng)分析》,騰訊廣點通高級工程師趙學敏的《大規(guī)模主題模型及其在騰訊的應用》,VMware 資深架構師介文清的《12306鐵路購票網站的架構優(yōu)化》,搜狐移動研發(fā)部經理劉佳的《基于全網內容的搜狐移動新聞客戶端推薦系統(tǒng)》,eBay 高級產品經理、Kylin 聯(lián)合創(chuàng)建者韓卿的《Kylin.io:基于 Hadoop 的大規(guī)模聯(lián)機分析(OLAP)引擎》,阿里小微金服(螞蟻金服)數據分析師陳繼東的《基于大數據的網絡安全與欺詐風險管理實踐》,沃爾瑪實驗室首席數據科學家 Tao Zhu 的《The 'Nanotechnology' in eCommerce 》,攜程資深軟件工程師廖曉格的《Make Big Data Visualizable and Real-Time》等。
理由八:大數據時代的資源管理技術。時至今日,云計算已經成為大數據底層資源調度的最佳平臺,然而云平臺的打造卻并不是件容易的事情。在 BDTC 2014上,我們特別邀請了 OpenStack 基金會董事杜玉杰,為我們分享名為《OpenStack 在大數據方面的思考:技術、應用、生態(tài)系統(tǒng)》的主題演講。而在智能網絡建設上,博科高級技術顧問谷增云更為我們帶來了 SDN 技術的實踐分享。數據中心層面,浪潮集團副總裁胡雷鈞會分享《開放融合的云數據中心》。數據存儲層面,希捷公司的技術專家將介紹開放計算項目(Open Compute Project,OCP)的存儲部分的技術內容。
理由九:基于公有云的大數據實踐。當下,云計算已越來越成熟,而公有云服務亦在各行各業(yè)得到了深入應用。本屆會議上,我們?yōu)榇蠹曳窒砹硕鄨龌诠性频拇髷祿䦟嵺`,其中包括 AWS 大數據和高性能計算框架全球高級營銷經理 Ben Butler 帶來的《AWS 大數據應用實踐》,Huawei EU Research Center 研發(fā)架構首席架構師 Sabri SKHIRI 分享的《Lambda Architecture 2.0 Convergence between Real-Time Analytics, Context-awareness and Online Learning 》, ODPS 資深技術專家徐常亮傳授的《ODPS 實踐》等。對于創(chuàng)業(yè)公司和技術實力不夠雄厚的機構來說,這里是絕對的天堂。
理由十:關系數據庫技術的最新進展。關系數據庫系統(tǒng)的研發(fā)并沒有停下腳步,在橫向擴展、高可用和高性能方面也在不斷進步。在今年的大會上,我們?yōu)榕c會者呈上中國移動集團公司業(yè)務支撐系統(tǒng)部項目經理、高級工程師何鴻凌的《MPP 數據庫技術及應用分析》,細說關系數據庫在 MPP 方向上的歷史發(fā)展和實例分析。柏睿數據科技有限公司董事長兼 CTO 劉睿民的《海量并行(MPP)內存數據倉庫的發(fā)展階段及實現(xiàn)探討》,探索數據倉庫內存化的需求、動機和可行性。阿里巴巴資深技術專家恒謙的《Oceanbase 數據庫實現(xiàn)基本問題解決/分布式優(yōu)化等》。網易自研 TNT/NTSE 引擎負責人核心開發(fā)人員胡煒的《網易數據庫數據壓縮技術實踐》。為傳統(tǒng)關系數據庫使用和開發(fā)人員處理大數據打開一扇窗。
除此以外,隨 BDTC 2014一起啟動的“第二屆中國大數據技術創(chuàng)新大賽”和“第二屆全國大數據創(chuàng)新項目評選 ” 也已進入火爆的評選階段。 針對百度大數據創(chuàng)意及應用,多媒體展示廣告點擊率預估,基于人物的相關網絡視頻挖掘,電商消費行為預測,用戶瀏覽新聞的模式分析及個性化新聞推薦,系列危害公共安全事件的關聯(lián)關系挖掘及預測,基于互聯(lián)網大數據的日志類應用處理等七道賽題的近900支隊伍已完成作品提交,正式進入評審環(huán)節(jié)。 大會將舉行獲獎隊伍的頒獎儀式并組織獲獎作品的專場報告會。 而包含大規(guī);ヂ(lián)網架構技術,大數據存儲與分析(數據挖掘、商務智能、機器學習/深度學習、數據可視化),高性能計算領域的創(chuàng)新項目與產品,大規(guī);ヂ(lián)網的建設、管理與服務,虛擬化技術,開源技術 Hadoop、Spark 等項目應用, 大數據行業(yè)分析等領域的近百個國內團隊正在積極地爭奪大會現(xiàn)場的10個微型展位。相信在這里,你可以收獲無數的創(chuàng)新機會和更為志同道合的創(chuàng)業(yè)伙伴。
如果認同大數據發(fā)展趨勢,如果重視技術人才和工程師在大數據時代的意義,如果期待技術實踐能帶來一日千里的發(fā)展,如果決心塑造新的企業(yè)關鍵競爭力,那就不要錯過2014中國大數據技術大會。目前購票火爆, 團體購票可享受8折優(yōu)惠,個人票僅有部分剩余, 迅速搶票 。
CSDN 誠邀您參加中國大數據有獎大調查活動,只需回答23個問題就有機會獲得最高價值2700元的大獎(共10個),速度參與進來吧 。