自2000年左右初試啼聲以來(lái),中國(guó)的互聯(lián)網(wǎng)產(chǎn)業(yè)正在迎來(lái)第二個(gè)巨大的發(fā)展契機(jī)。在層出不窮的商業(yè)模式創(chuàng)新帶動(dòng)之下,在擁有雄厚實(shí)力和用戶基礎(chǔ)的BAT引領(lǐng)之下,在創(chuàng)新的公有云技術(shù)的支持之下,越來(lái)越多擁有創(chuàng)新想法的互聯(lián)網(wǎng)企業(yè)得到了比以往更好的發(fā)展機(jī)遇。
而對(duì)于互聯(lián)網(wǎng)行業(yè)而言,作為最基礎(chǔ)生產(chǎn)資料的IT基礎(chǔ)架構(gòu),對(duì)于企業(yè)開(kāi)展業(yè)務(wù)的重要性要遠(yuǎn)遠(yuǎn)大于任何一個(gè)行業(yè)。因此對(duì)包括服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)在內(nèi)的IT基礎(chǔ)架構(gòu),互聯(lián)網(wǎng)企業(yè)投入的關(guān)注也要高于絕大多數(shù)的行業(yè)。
與一般互聯(lián)網(wǎng)企業(yè)相比,移動(dòng)互聯(lián)網(wǎng)由于應(yīng)用本身的規(guī)模相對(duì)于PC端應(yīng)用更小、更簡(jiǎn)單,基于移動(dòng)平臺(tái)提供服務(wù)的互聯(lián)網(wǎng)企業(yè)對(duì)于IT基礎(chǔ)架構(gòu)的需求也有著比較明顯的差異。在移動(dòng)領(lǐng)域,初創(chuàng)的互聯(lián)網(wǎng)服務(wù)商選擇公有云平臺(tái)服務(wù),以減少I(mǎi)T管理壓力的比重要顯著更高。而那些在移動(dòng)互聯(lián)網(wǎng)服務(wù)領(lǐng)域已經(jīng)擁有相當(dāng)業(yè)務(wù)基礎(chǔ),需要依托自己的數(shù)據(jù)中心來(lái)開(kāi)展業(yè)務(wù)的互聯(lián)網(wǎng)服務(wù)商而言,更簡(jiǎn)單、更易用,在配置方面更為標(biāo)準(zhǔn)化,能更便利地實(shí)現(xiàn)橫向擴(kuò)充以應(yīng)對(duì)快速增長(zhǎng)的業(yè)務(wù)需求的IT基礎(chǔ)架構(gòu),更容易受到IT主管們的青睞。
成立于2005年的宜搜公司就是專(zhuān)注于移動(dòng)市場(chǎng)的互聯(lián)網(wǎng)服務(wù)商中一個(gè)典型的代表。成立九年以來(lái),宜搜公司的IT基礎(chǔ)架構(gòu)規(guī)模隨著業(yè)務(wù)的不斷增長(zhǎng),而在2007、2009和2011年有過(guò)3次大規(guī)模的擴(kuò)張,目前公司數(shù)據(jù)中心中整體的服務(wù)器數(shù)量超過(guò)3000臺(tái)。其主要業(yè)務(wù)來(lái)自不同類(lèi)型的每天數(shù)億次以上的搜索請(qǐng)求,以及手游等其他業(yè)務(wù)。
圖片和小說(shuō)等基于移動(dòng)端的內(nèi)容搜索,是移動(dòng)端手機(jī)搜索中一個(gè)重要的功能。以宜搜提供的圖片搜索為例,其主要針對(duì)手機(jī)用戶提供適合手機(jī)觀看的精品圖片,目前資源總量超過(guò)數(shù)億張,其中包括jpg,gif等多種圖片格式。?而在圖片搜索系統(tǒng)的最近一次更新中,宜搜采用了來(lái)自深圳云海麒麟公司提供的存儲(chǔ)服務(wù)器和緩存服務(wù)器作為承載整個(gè)系統(tǒng)的解決方案,并實(shí)現(xiàn)了整體搜索性能的較大提升。
宜搜科技首席技術(shù)官呂晉介紹,公司與云海麒麟之間的合作關(guān)系開(kāi)始于2013年底,而在使用云海麒麟服務(wù)器的半年多時(shí)間內(nèi),宜搜對(duì)這一新品牌提供的服務(wù)器質(zhì)量和可靠性也給予了充分的肯定。
在服務(wù)器圈子中,成立于2013年11月的云海麒麟是一家全新的公司。公司產(chǎn)品總監(jiān)李增光介紹,為互聯(lián)網(wǎng)公司等少數(shù)幾個(gè)行業(yè)提供專(zhuān)門(mén)定制的IT基礎(chǔ)架構(gòu),是公司在業(yè)務(wù)上最為主要的定位。“在美國(guó),有很多小的服務(wù)器廠商專(zhuān)門(mén)為一到兩個(gè)行業(yè),甚至一兩個(gè)用戶專(zhuān)門(mén)做定制化的服務(wù)器產(chǎn)品,做得很專(zhuān)業(yè)、很精致。我覺(jué)得這也是我們可以學(xué)習(xí)的地sa方。”他介紹,“我們公司也是按照這個(gè)思路來(lái)發(fā)展,成立半年多以來(lái),圍繞互聯(lián)網(wǎng)、安防監(jiān)控、信息安全等重要的領(lǐng)域,我們已經(jīng)與客戶形成了有效的互動(dòng),完善了從塔式到機(jī)架式,到四路、八路服務(wù)器再到存儲(chǔ)在內(nèi)的產(chǎn)品線,在全國(guó)11個(gè)地方建立了辦事處,并和英特爾這樣的上游廠商建立了良好的合作關(guān)系。”
快速的響應(yīng)和部署,是互聯(lián)網(wǎng)行業(yè)最大的特點(diǎn),而在移動(dòng)互聯(lián)網(wǎng)行業(yè)中,則更是將這種“天下武功,唯快不破”的特點(diǎn)發(fā)揮到了極致。傳統(tǒng)互聯(lián)網(wǎng)行業(yè)之中,人與PC每天互動(dòng)的時(shí)間是有限的,但在移動(dòng)時(shí)代到來(lái)之后,人與智能手機(jī)、平板電腦之間的互動(dòng)時(shí)間幾乎是除了睡覺(jué)之外的所有時(shí)間。在新技術(shù)、新理念引入上落后別人一步,就會(huì)喪失發(fā)展的先機(jī)。因此在IT基礎(chǔ)架構(gòu)的部署方面,IT基礎(chǔ)架構(gòu)廠商需要提供標(biāo)準(zhǔn)化與定制化結(jié)合的解決方案,一方面為移動(dòng)互聯(lián)網(wǎng)服務(wù)商迅速敏捷的業(yè)務(wù)變化提供支持,另一方面又要保證能夠滿足移動(dòng)產(chǎn)業(yè)隨時(shí)的創(chuàng)新產(chǎn)生的對(duì)IT基礎(chǔ)架構(gòu)個(gè)性化的需求。
在宜搜公司,每天基于移動(dòng)平臺(tái)的內(nèi)容搜索需求以PB級(jí)計(jì)算,對(duì)于后臺(tái)存儲(chǔ)的量級(jí)要求非常高。但是在海量的搜索內(nèi)容中,可能只有1%的數(shù)據(jù)是每天必須被用到或者訪問(wèn)的,剩下的絕大部分都是冷數(shù)據(jù),可能會(huì)幾天甚至一兩個(gè)月之內(nèi)都不會(huì)有用戶訪問(wèn)一次。
作為典型的移動(dòng)互聯(lián)網(wǎng)搜索類(lèi)應(yīng)用,宜搜圖片搜索需要一套對(duì)數(shù)據(jù)進(jìn)行有效分層存儲(chǔ)的大型緩存機(jī)制。如果所有數(shù)據(jù)都存儲(chǔ)在磁盤(pán)中進(jìn)行讀寫(xiě),每天數(shù)以?xún)|計(jì)的搜索請(qǐng)求之下,性能難免會(huì)打折扣。因此采用固態(tài)盤(pán)建立緩存服務(wù)器存儲(chǔ)熱數(shù)據(jù),將冷數(shù)據(jù)存儲(chǔ)在低成本的SATA接口硬盤(pán)中,從性?xún)r(jià)比方面考慮是最為合適的解決方案。
云海麒麟為宜搜提供的解決方案,就是由YH-5212S:2U12盤(pán)位SATA硬盤(pán),配備至強(qiáng)E5-2609或2620 v2的存儲(chǔ)服務(wù)器,加上YH-5210:2U8盤(pán)位,配備英特爾至強(qiáng)E5-2630或2640 v2處理器以及英特爾企業(yè)級(jí)固態(tài)盤(pán)的緩存服務(wù)器組成。在存儲(chǔ)高熱點(diǎn)數(shù)據(jù)的環(huán)境中,云海麒麟提供配備英特爾PCI-E接口固態(tài)盤(pán)的解決方案,為宜搜的搜索服務(wù)在基礎(chǔ)架構(gòu)上提供最強(qiáng)性能的支持。
在服務(wù)器的網(wǎng)絡(luò)接口方面,出于總體成本考慮,云海麒麟為宜搜內(nèi)容搜索系統(tǒng)配備了基于英特爾千兆網(wǎng)卡的解決方案。但李增光介紹,在英特爾提供的優(yōu)化指導(dǎo)和技術(shù)支持之下,云海麒麟在CPU核心數(shù)和網(wǎng)卡隊(duì)列之間的匹配等方面,已經(jīng)開(kāi)展了許多的調(diào)優(yōu)工作,充分發(fā)揮出了千兆網(wǎng)絡(luò)應(yīng)有的性能?!叭绻麤](méi)有來(lái)自上游廠商的支持,單憑我們是無(wú)法充分發(fā)揮出現(xiàn)有解決方案的全部潛力的。”他表示。
在分層存儲(chǔ)領(lǐng)域,許多專(zhuān)門(mén)的存儲(chǔ)廠商都能提供完整的解決方案,但在呂晉看來(lái),這些解決方案的成本過(guò)高,而作為其重要賣(mài)點(diǎn)的高可靠性存儲(chǔ)也不是移動(dòng)互聯(lián)網(wǎng)行業(yè)最為根本的需求。“我們存儲(chǔ)的數(shù)據(jù)規(guī)模比較大,而且由于每天互聯(lián)網(wǎng)上的數(shù)據(jù)都在變化,對(duì)數(shù)據(jù)更新的需求也是比較快的?!眳螘x說(shuō),“我們的數(shù)據(jù)不像銀行、政府機(jī)關(guān)存儲(chǔ)的數(shù)據(jù)那樣,需要長(zhǎng)期穩(wěn)定的保留,因此也不需要對(duì)數(shù)據(jù)絕對(duì)不能丟失的保障。因此,我們采用分布式架構(gòu)進(jìn)行數(shù)據(jù)存儲(chǔ),相比起低成本和高效率,實(shí)施、維護(hù)過(guò)程中的易用性等關(guān)鍵因素,數(shù)據(jù)本身在可靠性方面的小問(wèn)題并不是我們關(guān)注的重點(diǎn)?!?/p>
在通過(guò)緩存服務(wù)器方式實(shí)現(xiàn)分層存儲(chǔ)的初期,宜搜也采用過(guò)非英特爾固態(tài)盤(pán)的解決方案進(jìn)行過(guò)測(cè)試,但發(fā)現(xiàn)要么是效果并不理想,要么是成本過(guò)高而效益無(wú)法體現(xiàn)。“采用英特爾至強(qiáng)處理器結(jié)合英特爾固態(tài)盤(pán)的解決方案,在性?xún)r(jià)比和穩(wěn)定性方面都能比較符合我們的期望。而英特爾架構(gòu)標(biāo)準(zhǔn)化的配置也會(huì)比較順暢,我們?cè)谡麄€(gè)解決方案的部署過(guò)程之中都非常順利,沒(méi)有遇到過(guò)預(yù)料之外的問(wèn)題。這對(duì)于速度就是一切的互聯(lián)網(wǎng)行業(yè)來(lái)說(shuō)是非常重要的?!?/p>
“我們?cè)谠缙谑褂眠^(guò)一些基于其他品牌的服務(wù)器產(chǎn)品,經(jīng)過(guò)幾次更新?lián)Q代,現(xiàn)在采用的全部都是基于英特爾架構(gòu)的產(chǎn)品?!眳螘x介紹,“無(wú)論是從架構(gòu)的成熟度、穩(wěn)定性、計(jì)算能力,還是從整個(gè)解決方案的性?xún)r(jià)比方面考慮,基于英特爾架構(gòu)的服務(wù)器和存儲(chǔ)產(chǎn)品都是互聯(lián)網(wǎng)行業(yè)更好的選擇?!?/p>
由于云海麒麟公司的成立正好趕上英特爾至強(qiáng)v2處理器的推出,在公司成立初期,主推的服務(wù)器就已經(jīng)是基于英特爾至強(qiáng)v2的產(chǎn)品,在今年2月開(kāi)始正式對(duì)宜搜供貨時(shí),提供的舊已經(jīng)全部是基于英特爾至強(qiáng)v2的設(shè)備。而至強(qiáng)v2在性能上相較于前一代產(chǎn)品的提升,也為云海麒麟和宜搜雙方留下了非常深刻的印象。
“一個(gè)典型的例子是從去年11月,我們就開(kāi)始用E5 v2給宜搜做測(cè)試,將E5-2620提升到E5-2620 v2,兩代產(chǎn)品的功耗差不多,但要滿足同樣的性能需求,現(xiàn)在只需要60%左右數(shù)量的處理器就可以,單個(gè)CPU的性能提升了三四成以上?!崩钤龉庹f(shuō),“在這種情況下,宜搜不需要進(jìn)行大規(guī)模的系統(tǒng)擴(kuò)容,只需要將現(xiàn)有的設(shè)備進(jìn)行更新,就足夠滿足日益增長(zhǎng)的業(yè)務(wù)對(duì)于IT基礎(chǔ)架構(gòu)的需求。”
而宜搜在項(xiàng)目中為新生的云海麒麟公司提供的大力配合,也同樣給李增光留下了深刻的印象。在項(xiàng)目初期用于測(cè)試的樣機(jī)方面,宜搜主動(dòng)提出采購(gòu)一半的樣機(jī),而云海麒麟提供另一半樣機(jī),開(kāi)展為期三四個(gè)月的測(cè)試工作?!霸谘邪l(fā)測(cè)試階段就花錢(qián)買(mǎi)樣機(jī)的,我們以前真的很少碰到過(guò)。”李增光表示,“這對(duì)于我們初創(chuàng)階段的企業(yè)而言,的確是很大的幫助?!?/p>
或許,云海麒麟提供的服務(wù)器產(chǎn)品的性能,以及為宜搜打造定制化產(chǎn)品的誠(chéng)意,是宜搜以友好姿態(tài)與云海麒麟合作的重要原因。在三次大規(guī)模的服務(wù)器擴(kuò)充完成之后,宜搜的業(yè)務(wù)走上穩(wěn)定發(fā)展的軌道,加上虛擬化技術(shù)的發(fā)展,使得服務(wù)器規(guī)模的大規(guī)模提升不再有必要。但在呂晉看來(lái),計(jì)算能力的提升仍舊是宜搜未來(lái)業(yè)務(wù)發(fā)展方向上會(huì)比較關(guān)注的一個(gè)重點(diǎn)問(wèn)題。
在宜搜目前更為關(guān)注的業(yè)務(wù)領(lǐng)域,如通過(guò)Hadoop集群實(shí)現(xiàn)的數(shù)據(jù)分析和挖掘,以及以語(yǔ)音方式實(shí)現(xiàn)的移動(dòng)搜索等領(lǐng)域,都需要更為強(qiáng)大的計(jì)算能力?!拔覀兤诖⑻貭栐谖磥?lái)能一如既往地在計(jì)算能力方面不斷創(chuàng)新,為互聯(lián)網(wǎng)行業(yè)提供更優(yōu)秀的計(jì)算工具?!眳螘x表示。
而云海麒麟也對(duì)雙方未來(lái)進(jìn)一步的合作和創(chuàng)新給予了充分的期待。在李增光看來(lái),目前用于存儲(chǔ)冷數(shù)據(jù)的2U12存儲(chǔ)服務(wù)器如果采用異形主板,還有機(jī)會(huì)提供更高的存儲(chǔ)密度,而對(duì)冷數(shù)據(jù)和熱數(shù)據(jù)進(jìn)行更為高效的分層存儲(chǔ)上,目前宜搜采用的解決方案還有更多優(yōu)化的機(jī)會(huì)?!盎诓粩噙M(jìn)步的英特爾數(shù)據(jù)中心解決方案,我們也會(huì)在為改善互聯(lián)網(wǎng)客戶使用體驗(yàn)的道路上不斷創(chuàng)新?!彼硎?。
原文閱讀:http://www.spn.com.cn/news/20140711/45397.html