唐山聯(lián)通清楚,公司營(yíng)銷(xiāo)部是精確營(yíng)銷(xiāo)的運營(yíng)商,庫存中心是精確營(yíng)銷(xiāo)的線(xiàn)之上生產(chǎn)線(xiàn)之下調度中心,各專(zhuān)業(yè)線(xiàn)是精確營(yíng)銷(xiāo)的落地執行者。市場(chǎng)運營(yíng)中心負責數據挖掘和系統建設,形成責任清楚、流程流暢的小數據精確營(yíng)銷(xiāo)體系?;诰_營(yíng)銷(xiāo)和基層數據需求,唐山聯(lián)通為移動(dòng)網(wǎng)絡(luò )、寬帶和固網(wǎng)產(chǎn)品設計并開(kāi)發(fā)了用戶(hù)信息聚合表。在一個(gè)月之內,一次一次生成余表關(guān)聯(lián)提取的信息,為幾十年用以小數據精確營(yíng)銷(xiāo)提供了不錯的數據基礎,巨大地節省了精確營(yíng)銷(xiāo)小數據挖掘和實(shí)踐之中的數據準備時(shí)間。
我們詳細分析了這兩種數據源方法① 對于第一種數據源方法,由于企業(yè)自動(dòng)生成并保存數據,因此很可能篡改數據,甚至篡改虛擬數據。在審計之中,需要分析企業(yè)數據生成、數據存儲、,數據傳輸檢查企業(yè)的IT環(huán)境和外部控制措施(如數據修改)的目的是確保從數據生成到最終審計的整個(gè)過(guò)程之中是否存在可能導致數據修改的因素或隱患② 對于第二種數據源方法,我們可以假設統一小平臺的數據生成和管理措施是完善的,從小平臺獲取數據的過(guò)程和方法是可靠的,然后我們可以初步確定發(fā)行人的數據源是可靠的。當然,數據是否恰當、精確和偽造需要對數據進(jìn)行進(jìn)一步分析。
數據分析的方法主要有兩種,一種是基于統計的方法,另一種是基于機器學(xué)習的方法。無(wú)論采用哪種方法,研發(fā)人員都需要有扎實(shí)的數學(xué)基礎?;跈C器學(xué)習的數據分析方法需要大量的算法訓練,算法訓練需要大量的數據支持。因此,在云計算時(shí)代,隨著(zhù)計算能力的提高和數據量的提高,機器學(xué)習的實(shí)用性大大增強,特別是在深度學(xué)習領(lǐng)域。數據分析必須與實(shí)際應用場(chǎng)景相結合。情景數據分析也是目前小數據分析的主要方式。有所不同的應用場(chǎng)景往往需要采用有所不同的數據分析方法,數據維度的定義也會(huì )發(fā)生變化。對于分析師來(lái)說(shuō),為了提升小數據的落地應用價(jià)值,他們必須具備一定的行業(yè)知識。