<th id="8nylm"></th>

<nav id="8nylm"></nav>_{<li id="8nylm"></li>}

<dd id="8nylm"><pre id="8nylm"></pre></dd>

歡迎，客人 | 請登錄 | 免費注冊 | 忘記密碼？

當前位置: 首頁 » 綜合資訊 » 媒體之聲 » 企業 »

壹看板CEO趙乾坤博士：新時代商業智能需要全新解讀

發布日期：2018-04-02 華人噴碼網來源：CCTIME飛象網

核心提示商業智能是一套完整的解決方案，用來將企業中現有的數據進行有效的整合，快速準確的提供報表并提出決策依據，幫助企業做出明智的業務經營決策。在當今大數據、人工智能等技術爆發的時代，我們又應該怎么解讀適應時代

商業智能是一套完整的解決方案，用來將企業中現有的數據進行有效的整合，快速準確的提供報表并提出決策依據，幫助企業做出明智的業務經營決策。在當今大數據、人工智能等技術爆發的時代，我們又應該怎么解讀適應時代發展的商業智能呢?

萬物皆為數

隨著大數據落地的不斷深入，越來越多的企業意識到數據的價值。然而眾人統一的認知，或者是大部分商業智能從業者的認知，都局限在結構化數據的邏輯。也就是說他們認為所有的數據最終都是可以存儲到數據庫的，或者說都是經過采集，清洗，整合后的高質量數據。

事實上目前數據的定義已經完全超越了數據庫的存儲邏輯，不管是關系型還是最新的NoSQL或者Graph database，目前存儲在數據庫之外的數據量是遠遠超過存儲在數據庫內的數據。

在商業智能分析中，數據源有網頁，pdf，圖片，音頻，視頻等等都具有很重要的價值。比如在新零售的場景下，我們對于線下商品展示和商品包裝等相關數據的分析需求日益增加。商品的銷量與他擺放的位置，以及商品包裝的顏色等有何相關性?如何分析?我們是需要提前將所有相關的信息都采集下來然后清洗并結構化存儲以備分析嗎?

采集和存儲是必須的，但是靠傳統商業智能清洗和結構化那些數據，還是比較困難。隨著技術的發展，我們可以通過成熟的相關分析工具加自定義腳本的方式來靈活分析上面提到的問題，甚至對基于圖片中色彩模式，物體相似度等的檢索和分析都有第三方支持。

話說回來，新時代的商業智能，對于萬物皆為數該如何理解呢?數據已經不是傳統的數字或者數據庫的邏輯，數據已經是所有物品必須添加的一個新維度或者屬性。 同時商業智能分析要突破傳統數據倉庫和數據庫的思路，在商業邏輯之下提出各種開腦洞的數據需求和分析需求。

數據架構之供應鏈思維

商業智能中數據架構至關重要，它是所有商業分析的基礎。所謂數據架構就是如何存儲和管理你的數據，在哪里存儲，以及為什么要使用這種管理邏輯。 人們通常會直接把這個問題局限在傳統數據庫中的數據建模(關系和數據結構的設計)上，但是數據架構的核心任務是設計一套數據的供應鏈邏輯，讓數據在整個生產、采集整合、分發，消費等環節具備高效的邏輯，這往往不止是一個數據建模的問題。

并且數據架構也需要解決不同商業場景下對數據分析、數據科學相關數據處理的支持設計。所以數據架構更重要的是梳理和設計出來一套完整的邏輯，在這個抽象層面之下才是具體的存儲和管理，有了目標之后就更容易做出好的數據架構。

說到商業智能數據架構不得不說一下傳統的數據倉庫。本質上數據倉庫解決的是數據湖的問題，將不同地方的數據整合在一起并實現關聯是數據分析的基礎。一般數據倉庫項目的周期都會比較長，短則半年數月，長則幾年。這個也容易理解，數據倉庫搭建過程中對于數據的打通，清洗，關聯，建模等都不是一項短時間能完成的任務，這個與數據倉庫項目的整體目標有關。如果希望搭建一套完整的滿足各種業務分析需求的，還依賴于現有業務邏輯和數據生產的復雜系統。

現實情況是不同的數據源甚至是數據維度或者片段對于商業分析的價值是不一樣的。而在這個過程中，對于不同數據預判的缺失導致在整個ETL中的投入過大。后來有了hadoop之后，大家還是一個數據中心的思路，什么數據都往hadoop里面寫，后續要用再來找。這樣也會出現一些問題，比如在數據流的場景下，你會發現很多流式數據很難持續存儲到數據庫中，因為數據采集和數據查詢本身就是兩種不同的場景和階段。

整體來說數據架構的設計包含四個不同的維度，數據的生產，采集整合，分發，和消費。梳理清楚他們之間的邏輯，以實現通暢的數據供應鏈的目標。其中任何一部分都可以靈活支持各種方式，例如數據的分發，類比線下零售體系，我們會有不同的分發體系來支持不同的渠道，比如中心倉和地方倉，電商倉和渠道倉等邏輯。所以新時代的數據架構可以是一個多條線并行的架構，不一定是一個完全中心化的數據倉庫的設計邏輯。

商業智能和數據科學

傳統商業智能的核心目標是數據的復用性，通過星型結構和范式模型的抽象來支持各種數據的存儲、查詢和報表業務。本質上商業智能解決了數據訪問和一部分數據探索的目的，然而他們能支持的問題變化不大所以對應的報表設計相對固定。但是在數據科學中很難有這種不變的數據結構或者計算模型來支持各種不同的算法，即使是算法本身也在不斷地演進的過程中。

在商業智能系統的設計過程中通過基礎的數據結構來描述所有的事物，然而并不關心背后的業務邏輯，往往是通過通用的描述模型來實現的。比如我們并不知道某商品的銷售總額到底代表什么意義，但是針對這個度量我們支持求和、平均等等一系列的操作。傳統數據倉庫的設計主要是基于需求背后的統一計算模型和邏輯而抽象出來的。

數據科學相關的分析問題卻很難用統一的抽象結構和計算模型來描述。簡單來說你需要做更多的統計學計算，比如一些相關系數的計算，從向量到矩陣的基本運算等。不止是這些計算的復雜度和資源消耗發生了巨大變化，同時不同的算法背后能被抽象出來的標準計算模型也非常有限。這也就是為什么曾經有大量的數據科學家做特征工程的工作，也就是基于不同的算法和對業務的理解來做特征抽取的工作，然后基于特征抽取來做各種算法的對比試驗。特征工程本質就是從抽象的存儲到抽象的計算模型的一個過渡。

從本質上來說數據科學的數據架構和傳統商業智能的架構設計的邏輯可以類似。隨著數據倉庫和商業智能的發展，很多方法和框架已經非常成熟，所以現在企業在選擇商業智能和數據科學的時候還有一條中間的道路就是：將數據倉庫（商業智能）作為數據科學的一個數據可訪問性的中間件，然后再基于商業智能和數據科學來設計出不同的數據存儲抽象和數據模型抽象來支持各自的數據架構。

關于作者：

趙乾坤壹看板創始人兼CEO

趙乾坤博士，數據挖掘專家，先后畢業于華中科技大學、新加坡南洋理工大學，并于美國賓夕法尼亞大學完成搜索引擎相關的博士后研究。其相關的研究和應用在國際知名學術會議(WWW，KDD，AAAI，CIKM 等)上發表了 20 余篇論文和講座，2 項國際的專利技術。曾任好耶廣告北京首席架構師、西班牙電信大數據科學家、AOLChina 發起人，后創立脈博網與37degree。有深厚的數據挖掘技術背景和十余年的互聯網行業經驗，是大數據在傳統企業和互聯網廣告應用設計師和實踐者。

打賞

?

免責聲明：
本網站部分內容來源于網站會員、合作媒體、企業機構、網友提供和互聯網的公開資料等，僅供參考。本網站對站內所有資訊的內容、觀點保持中立，不對內容的準確性、可靠性或完整性提供任何明示或暗示的保證。如果有侵權等問題，請及時聯系我們，我們將在收到通知后第一時間妥善處理該部分內容。

圖文推薦

同類資訊

推薦圖文

您在本欄的歷史瀏覽

熱門資訊

返回頂部

中國噴碼標識行業權威門戶網站引領行業發展

微信號:pm168net

網站首頁 | 網站地圖 | 誠征英才 | 關于我們 | 聯系方式 | 使用協議 | 版權隱私 | 排名推廣 | 廣告服務 | 積分換禮 | 網站留言 | RSS訂閱

版權所有：華人噴碼網北京瑞紀華人科技有限公司京ICP證060984 | 京ICP備07503063號

聯系電話：010-51658061 E-mail:bjsale#pm168.net（請把#替換成@）在線QQ：646539921

站所有信息均屬本站版權所有，如需轉載請注明來源地址域名:www.futingmy.com

国产一区在线视频