全國服務(wù)熱線:400-080-4418

您現(xiàn)在的位置是:首頁 > 新聞資訊 > 網(wǎng)站建設(shè)常識(shí)

探析電子商務(wù)中數(shù)據(jù)挖掘方法的應(yīng)用2010/4/29 17:25:18 瀏覽:47

  上海企業(yè)網(wǎng)站建設(shè)摘要:電子商務(wù)是現(xiàn)代商業(yè)的主流趨勢(shì),如何充分利用網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)發(fā)揮企業(yè)優(yōu)勢(shì),成為企業(yè)制勝的法寶。本文介紹了常用的數(shù)據(jù)挖掘方法,以及在電子商務(wù)領(lǐng)域的應(yīng)用,分析了利用數(shù)據(jù)挖掘技術(shù)建設(shè)動(dòng)態(tài)、高效電子商務(wù)的可行性。

    一、引言企業(yè)網(wǎng)站建設(shè)

  電子商務(wù)是指以Internet網(wǎng)絡(luò)為載體、利用數(shù)字化電子方式開展的商務(wù)活動(dòng)。隨著網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)的飛速發(fā)展,電子商務(wù)正顯示越來越強(qiáng)大的生命力。電子商務(wù)的發(fā)展促使公司內(nèi)部收集了大量的數(shù)據(jù),并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識(shí),為公司創(chuàng)造更多潛在的利潤。利用數(shù)據(jù)挖掘技術(shù)可以有效地幫助企業(yè)分析從網(wǎng)上獲取的大量數(shù)據(jù),發(fā)現(xiàn)隱藏在其后的規(guī)律性,提取出有效信息,進(jìn)而指導(dǎo)企業(yè)調(diào)整營銷策略,給客戶提供動(dòng)態(tài)的個(gè)性化的高效率服務(wù)。

  二、數(shù)據(jù)挖掘技術(shù)上海網(wǎng)站推廣

  1.數(shù)據(jù)挖掘

  數(shù)據(jù)挖掘(Data Mining),又稱數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database, KDD),是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等方面的知識(shí)。數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用領(lǐng)域,它不僅是面向特定數(shù)據(jù)庫的簡單檢索查詢調(diào)用,而且,要對(duì)數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)計(jì)、分析、綜合和推理,以指定實(shí)際問題的求解,企圖發(fā)現(xiàn)事件間的相互關(guān)聯(lián),甚至利用已有的數(shù)據(jù)對(duì)未來的活動(dòng)進(jìn)行預(yù)測(cè)。數(shù)據(jù)挖掘技術(shù)在金融、保險(xiǎn)、電信、大型超市等積累有大量數(shù)據(jù)的電子商務(wù)行業(yè)有著廣泛的應(yīng)用,如信用分析、風(fēng)險(xiǎn)分析、欺詐檢驗(yàn)、用戶聚類分析、消費(fèi)者習(xí)慣分析等。

  2.數(shù)據(jù)挖掘過程

  挖掘數(shù)據(jù)過程可以分為3個(gè)步驟:數(shù)據(jù)預(yù)處理、模式發(fā)現(xiàn)、模式分析。

  (1)數(shù)據(jù)預(yù)處理。實(shí)際系統(tǒng)中的數(shù)據(jù)一般都具有不完全性、冗余性和模糊性。因此,數(shù)據(jù)挖掘一般不對(duì)原始數(shù)據(jù)進(jìn)行挖掘,要通過預(yù)處理提供準(zhǔn)確、簡潔的數(shù)據(jù)。預(yù)處理主要完成以下工作:包括合并數(shù)據(jù),將多個(gè)文件或多個(gè)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行合并處理;選擇數(shù)據(jù),提取出適合分析的數(shù)據(jù)集合;數(shù)據(jù)清洗、過濾,剔除一些無關(guān)記錄,將文件、圖形、圖像及多媒體等文件轉(zhuǎn)換成可便于數(shù)據(jù)挖掘的格式等。

  (2)模式發(fā)現(xiàn)。模式發(fā)現(xiàn)階段就是利用挖掘算法挖掘出有效的、新穎的、潛在的、有用的以及終可以理解的信息和知識(shí)?捎糜赪eb的挖掘技術(shù)有路徑選擇、關(guān)聯(lián)分析、分類規(guī)則、聚類分析、序列分析、依賴性建模等等。

  (3)模式分析。模式分析是從模式發(fā)現(xiàn)階段獲得的模式、規(guī)則中過濾掉不感興趣的規(guī)則和模式。通過技術(shù)手段,對(duì)得到的模式進(jìn)行數(shù)據(jù)分析,得出有意義的結(jié)論。常用的技術(shù)手段有:關(guān)聯(lián)規(guī)則、分類、聚類、序列模式等。

  三、電子商務(wù)中幾種常用的數(shù)據(jù)挖掘方法上海做網(wǎng)站

  1.關(guān)聯(lián)規(guī)則

  關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘研究的主要模式之一,側(cè)重于確定數(shù)據(jù)中不同領(lǐng)域之間的關(guān)系,找出滿足給定條件下的多個(gè)域間的依賴關(guān)系。關(guān)聯(lián)規(guī)則挖掘?qū)ο笠话闶谴笮蛿?shù)據(jù)庫,該規(guī)則一般表示式為:A1∧A2∧…Am=>B1∧B2∧…Bm,其中,Ak(k=1,2,…, m),Bj(j=1,2,…,n)是數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)。有Support(A=>B)=P(A∪B),Confidence(A=>B)=P(A|B)。數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián),即根據(jù)一個(gè)事務(wù)中某些數(shù)據(jù)項(xiàng)的出現(xiàn)可以導(dǎo)出另一些數(shù)據(jù)項(xiàng)在同一事務(wù)中的出現(xiàn)。關(guān)聯(lián)分析的目的是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。關(guān)聯(lián)規(guī)則用于尋找在同一個(gè)事件中出現(xiàn)的不同項(xiàng)的相關(guān)性,比如在一次購買活動(dòng)中所買不同商品的相關(guān)性。關(guān)聯(lián)分析的典型例子是購物籃分析,描述顧客的購買行為,可以幫助零售商決定商品的擺放和捆綁銷售策略。如著名的(面包+黃油→牛奶)例子就屬于關(guān)聯(lián)分析:在超市中,90%的顧客在購買面包和黃油的同時(shí),也會(huì)購買牛奶。直觀的意義是:顧客在購買某種商品時(shí)有多大的傾向會(huì)購買另外一些商品。找出所有類似的關(guān)聯(lián)規(guī)則,對(duì)于企業(yè)確定生產(chǎn)銷售、產(chǎn)品分類設(shè)計(jì)、市場(chǎng)分析等多方面是有價(jià)值的。[Page]

  2.聚類分析方法上海網(wǎng)絡(luò)優(yōu)化

  類聚分析就是直接比較樣本中各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,而將性質(zhì)差別較大的分在不同的類。對(duì)變量聚類計(jì)算變量之間的距離,對(duì)樣本聚類則計(jì)算樣本之間的距離。它的目的是使得屬于同一類別的個(gè)體之間的距離盡可能小,而不同類別上的個(gè)體間的距離盡可能大。

  聚類分析用于把有相似特性的客戶、數(shù)據(jù)項(xiàng)集合到一起。在電子商務(wù)中,聚類分析常用于市場(chǎng)細(xì)分。根據(jù)已有客戶的數(shù)據(jù),利用聚類技術(shù)將市場(chǎng)按客戶消費(fèi)模式的相似性分為若干細(xì)分市場(chǎng),以進(jìn)行有針對(duì)性的市場(chǎng)營銷,提供更適合、更滿意的服務(wù)。如自動(dòng)給一個(gè)特定的客戶聚類發(fā)送銷售郵件,為一個(gè)客戶聚類動(dòng)態(tài)地改變一個(gè)特殊的站點(diǎn)等。通過對(duì)聚類的客戶特征的提取,電子商務(wù)網(wǎng)站還可以為客戶提供個(gè)性化的服務(wù)。

  3.分類分析

  分類系統(tǒng)是基于遺傳算法的機(jī)器學(xué)習(xí)中的一類,它包括一個(gè)簡單的基于串規(guī)則的并行生成子系統(tǒng)、規(guī)則評(píng)價(jià)子系統(tǒng)和遺傳算法子系統(tǒng)。分類系統(tǒng)正在被人們?cè)絹碓蕉嗟貞?yīng)用于科學(xué)、工程和經(jīng)濟(jì)領(lǐng)域中,是目前遺傳算法研究領(lǐng)域中一個(gè)非;钴S的領(lǐng)域。

  分類分析是數(shù)據(jù)挖掘中應(yīng)用多的方法。分類要解決的問題是為一個(gè)事件或?qū)ο髿w類,既可以用于分析已有的數(shù)據(jù),也可以用來預(yù)測(cè)未來的數(shù)據(jù)。分類通過分析已知分類信息的歷史數(shù)據(jù),總結(jié)出一個(gè)預(yù)測(cè)模型,預(yù)測(cè)哪些人可能會(huì)對(duì)郵寄廣告、產(chǎn)品目錄等有反應(yīng),可以針對(duì)這一類客戶的特點(diǎn)展開商務(wù)活動(dòng),提供個(gè)性化的信息服務(wù)。

  4.序列模式

  序列模式挖掘就是要挖掘出交易集之間有時(shí)間序列關(guān)系的模式。它挖掘的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后或因果關(guān)系,找到那些“一些項(xiàng)跟隨另一些項(xiàng)”,以預(yù)測(cè)未來的訪問模式。序列模式分析和關(guān)聯(lián)分析類似,其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但序列模式分析的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后序列關(guān)系。它能發(fā)現(xiàn)數(shù)據(jù)庫中形如“在某一段時(shí)間內(nèi),顧客購買商品A,接著購買商品B,而后購買商品C,即序列A-B-C出現(xiàn)的頻率較高”之類的知識(shí)。序列模式分析描述的問題是:在給定交易序列數(shù)據(jù)庫中,每個(gè)序列是按照交易時(shí)間排列的一組交易集,挖掘序列函數(shù)作用在這個(gè)交易序列數(shù)據(jù)庫上,返回該數(shù)據(jù)庫中出現(xiàn)的高頻序列。在進(jìn)行序列模式分析時(shí),同樣也需要有用戶輸入小置信度C和小支持度S。

  序列模式便于進(jìn)行電子商務(wù)的組織,預(yù)測(cè)客戶的訪問模式,對(duì)客戶開展有針對(duì)性的廣告服務(wù)或者主動(dòng)推薦客戶感興趣的頁面,以滿足訪問者的特定要求。

  四、結(jié)束語上海網(wǎng)站建設(shè)

  電子商務(wù)是現(xiàn)代信息技術(shù)發(fā)展的必然結(jié)果,也是未來商業(yè)運(yùn)作模式的必然選擇。利用數(shù)據(jù)挖掘技術(shù)來分析大量的數(shù)據(jù),可以挖掘出商品的消費(fèi)規(guī)律與客戶的訪問模式,幫助企業(yè)制定有效的營銷策略,充分發(fā)揮企業(yè)的獨(dú)特優(yōu)勢(shì),促進(jìn)管理創(chuàng)新和技術(shù)創(chuàng)新,提高企業(yè)競爭力。

  隨著電子商務(wù)發(fā)展的勢(shì)頭越來越強(qiáng)勁,面向電子商務(wù)的數(shù)據(jù)挖掘?qū)⑹且粋(gè)非常有前景的領(lǐng)域。它能自動(dòng)預(yù)測(cè)客戶的消費(fèi)趨勢(shì)、市場(chǎng)走向,指導(dǎo)企業(yè)建設(shè)個(gè)性化智能網(wǎng)站,帶來巨大的商業(yè)利潤,可以為企業(yè)創(chuàng)建新的商業(yè)增長點(diǎn)。但是在面向電子商務(wù)的數(shù)據(jù)挖掘中也存在很多問題急需解決,比如怎樣將服務(wù)器的日志數(shù)據(jù)轉(zhuǎn)化成適合某種數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)格式,怎樣解決分布性、異構(gòu)性數(shù)據(jù)源的挖掘,如何控制整個(gè)Web上知識(shí)發(fā)現(xiàn)過程等。隨著硬件環(huán)境、挖掘算法的深入研究及應(yīng)用經(jīng)驗(yàn)的積累,數(shù)據(jù)挖掘技術(shù)及在電子商務(wù)中的應(yīng)用必將取得長足的進(jìn)展。

 

服務(wù)網(wǎng)絡(luò)

關(guān)于我們

網(wǎng)至普專注于網(wǎng)站建設(shè)/網(wǎng)站優(yōu)化,始終追求 “您的滿意,我的追求!”。懂您所需、做您所想!我們一直在思考如何為客戶創(chuàng)造更大的價(jià)值,讓客戶更省心!立足上海,服務(wù)全國。服務(wù):上海,北京,廣州,深圳,成都,杭州,南京,蘇州,無錫等地

查看更多 >>

聯(lián)系我們

Copyright 2008 © 上海網(wǎng)至普信息科技有限公司 All rights reserved. 滬ICP備11006570號(hào)-13 滬公網(wǎng)安備 31011402007386號(hào)


關(guān)于我們 | 聯(lián)系我們 | 網(wǎng)站建設(shè)

返回頂部