《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于一種大數據應用架構的消費者行為分析
基于一種大數據應用架構的消費者行為分析
2014年微型機與應用第20期
湯仁民1,王代強2
1.貴州大學 電子信息學院,貴州 貴陽 550025; 2.貴州大學 人民武裝學院,貴州 貴陽 550025
摘要: 研究了一種大數據的應用程序框架,通過使用拓撲數據結構、共生技術分析和馬爾科夫鏈理論來分析消費者的購買行為。首先將與消費者相關的數據轉換成一種拓撲數據結構;然后使用拓撲關系、一種共生矩陣對消費者行為進行分析,推斷出馬爾柯夫鏈模型。仿真結果證實了該理論框架的有效性。
Abstract:
Key words :

  摘  要: 研究了一種大數據的應用程序框架,通過使用拓撲數據結構、共生技術分析和馬爾科夫鏈理論來分析消費者的購買行為。首先將與消費者相關的數據轉換成一種拓撲數據結構;然后使用拓撲關系、一種共生矩陣對消費者行為進行分析,推斷出馬爾柯夫鏈模型。仿真結果證實了該理論框架的有效性。

  關鍵詞: 大數據;消費者行為;拓撲數據結構;馬爾科夫鏈

0 引言

  隨著云技術的應用和普及,利用“數據”對消費者細分變得更為容易,在此“數據”之下形成的“精準”傳播正日益成為廠商的得力助手。大數據在經濟分析、災害預報、產品和服務跟蹤、消費行為洞察甚至在了解股市走向等方面大有用武之地,在發達國家已經開始普及應用,在中國也得到越來越多的運用。

  在消費領域,通過數以百萬計的網絡傳感器和視頻監控系統,人們能搜索到關于消費者和供應商的大量數據[1];各種媒體和社交網絡平臺中關于消費者的數據更是呈現指數式增長;用戶在各種社交網絡平臺中所生成的未經編輯的信息,包括結構化和非結構化的數據,讓人眼花繚亂。把這些海量數據統一稱作大數據。一般情況下,大數據具有批量、多品種、快速度三種特性[2-3]。

  另一方面,消費者行為分析是對消費者、產品商、運營商之間對諸如購買、節約、商標選擇等方面的關注[4]。此外,如今的消費者稱號不再是指過去單一的消費者行為,對他們的定義不再僅是買家,更是一種會引導電商零售企業營銷方式變遷的模式。為了分析消費者行為,獲取更多的信息是有必要的。在這個方面,對數據驅動決策作出,處理大數據已經成為了中心角色[5]。在大數據平臺中所搜集的數據的性質是各不相同的,為了分析這些數據,僅數據的數量和性質而言就是一個艱巨的挑戰[6]。本文用圖1所示的框架結構,通過數學拓撲以及與馬爾科夫鏈相結合的共生分析理論來分析這些海量數據以及如何能夠獲取有用的信息。

001.jpg

1 消費者行為分析的大數據框架

  應用于消費者行為分析的大數據框架圖由三個功能層組成,分別是數據組織層、分析建模層、預測推理層[7-8]。在數據組織層,收集到的數據在一個動力系統中被組織,以至于該數據能夠被看作是一個時間序列。具體而言,假設隨機變量分別為:

  Xt:在時間t時的數據量。

  Yt:出現在時間間隔為[t,t+1]的新數據。

  Zt:出現在時間間隔為[t,t+1]的劣化數據。

  該數據流可以在一個隨機方程中建模為:

  1.png

  可以通過線性回歸馬爾科夫鏈在式(2)中獲得Xt:

  E[Yt+1|Yt]=(1-ρ)E(Y)+ρYt(2)

  通過式(1)乘以Yt+1,再取其期望,同時使t→∞,這樣能夠獲得式(3):

  (1-ρ)E(XY)=(1-ρ)E(X)E(Y)+ρE(Y2)-ρE(Y)(3)

  在式(1)中代入E(XY)的值,通過式(4)獲得大數據的平均量:

  4.png

  對于代表當前特別關注的變量Xt,通過方程(4)將會得出時間序列數據。經產生的時間序列數據,構造出拓撲數據結構,這樣大數據能夠被存儲為所構造的拓撲數據而不失其一般性,該優勢是對大存儲器的需求顯著減少。同時,重要的信息能夠通過使用離散集而獲得,可以利用拓撲結構對該種消費行為進行研究。拓撲數據結構的基本概念是認識其數據的形狀或模式,用于發現數據,識別其有意義的數據子集,這樣的拓撲數據結構由滿足包含、相交和封閉性的采樣數據的子集集合而成。以下三種關鍵性的拓撲性質使得從大數據中可能提取出具有一定價值的數據:(1)無坐標性;(2)提取不同形狀下的一種客體模式的能力;(3)不失其重要特性的壓縮形狀。

  適用于上述三種特性的共生矩陣被處于分析建模層中的數據結構所建立。按行歸一化的共生矩陣、馬爾科夫轉移概率都能被估計,同時形成了一步轉移概率矩陣P。然后平穩分布π以及隨時間變化分布的Pt能夠通過(5)式獲得。最后這些可能性在預測推理層被用于獲取所需的特定信息。

  π=πPPt+1=Pt·P(5)

2 實驗結果



  為了說明該架構,對合成的消費者購買行為數據進行模擬。把購買消費品的時間序列數據收集起來并在表1中顯示出來,該數據包含了4種消費品和10個時間點。包含消費品的整個數據集是Xt={a,b,c,d},拓撲T被定義為Xt的子集集合,這樣T包含一個空集和整個集,T中的兩個集合并一定被包含在T中,且T中任何兩個集合的交叉點也必須被包含在T中,這樣包含的拓撲關系被用于建立處于拓撲T中數據集之間的共生矩陣。相應的共生矩陣如表2所示。通過共生矩陣行歸一化能夠得到一步轉移概率矩陣P。當t=2,3,4,…時,通過計算Pt能夠獲得t步轉移概率。在一般情況下,平衡狀態在t的一個有限值內達到。因此,當t=1,2,3,…時,通過繪制相應的t步概率獲得該種趨勢圖。最后,必要的信息能夠通過圖2所示的消費者趨勢圖推導出。在圖2中,水平線表示時間點,垂直線表示購買成對商品的模式。其中大數據分析最重要的方面之一便是通過解碼圖2中被編碼的定量信息和定性信息以顯示其結構和模式。通過圖2的解釋線圖能夠觀察到,在其他配對線趨勢圖之間,配對線趨勢圖(a,b)是最可能的結合,其次是配對線趨勢圖(a,d)。接下來發現的是包括物品b的線是處于頂部的一些線,這意味著物品b是最受歡迎的物品,這樣的結果與原始數據一致。結合了物品d但是沒有包括物品b的線是最低的,這解釋為物品d是最不受歡迎的。

002.jpg

3 結論

  本文結合消費者行為的非結構化數據,呈現了一種大數據應用程序框架。這是大數據分析的早期階段,在消費領域,通過使用真實的生活數據,分析消費品的購買情況,在網絡平臺上將會產生大量的數據源,通過這些數據精準了解消費者心理對企業的功能和作用,特別是對營銷來說更具有特別重大和實際的意義。

參考文獻

  [1] 吳響,張立,趙強,等.基于體域網的遠程健康監護系統設計[J].電子技術應用,2014,40(3):19-21.

  [2] 黃升民,楊雪睿.碎片化背景下消費行為的新變化與發展趨勢[J].廣告大觀(理論版),2006(2):4-9.

  [3] 竇炳琳,李澍淞,張世永.基于結構的社會網絡分析[J].計算機學報,2012,35(4):99-111.

  [4] 大數據成為信息科技新關注點[J].硅谷,2012(13):I0012.

  [5] 楊華磊.高頻數據對傳統經濟學研究范式的沖擊[EB/OL].[2013-01-27].blog.sciencenet.cn/blog-456786-656901.html.

  [6] 涂子沛.大數據[M].桂林:廣西師范大學出版社,2012.

  [7] Zhang Yihua, BLANTON M. Efficient dynamic provable possession of remote data via update trees[J]. Rearch in Computer Security(ESORICS′09), 2012(3):42-45.

  [8] Lin Jun, Yang Guangyu. Analyzing customer behavior Predicting-what happens next[DB]. Publisher: Across Technology, 2010(2):53-56.


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 人人色网 | 亚洲日本中文字幕永久 | 亚洲一区2区三区4区5区 | 操美女在线视频 | 狠狠色婷婷丁香六月 | 一区二区高清视频在线观看 | 成人a视频片在线观看免费 成人a视频高清在线观看 | 国产自线一二三四2021 | 亚洲无线乱码高清在线观看一区 | 免费观看大片毛片 | 一级免费黄色录像 | 2020久久精品国产免费 | 天天射综合网站 | 手机看片1024国产 | 成人综合激情网 | 99久久综合 | 久久精品视频亚洲 | 日韩爽爽爽视频免费播放 | 91导航福利| 亚洲无遮挡| 免费一级毛片清高播放 | 一级特黄a免费大片 | 免费看真人a一级毛片 | 久久亚洲私人国产精品 | 中文字幕一区视频 | 狠狠狠狠狠狠狠狠 | 欧美成人爽片 | 波多野结衣免费一区二区三区香蕉 | 国产无人区卡一卡二卡三网站 | 波多野结衣视频免费 | 亚洲国产欧美在线不卡中文 | 国产精品麻豆综合在线 | 久久香蕉精品视频 | 日本三级黄视频 | 最新国产福利片在线观看 | 嗯灬啊灬用力再用力ca视频 | 猛h辣h高h文湿重口 美日毛片 | 欧美影视一区二区三区 | 青春草视频在线观看免费 | 3751性欧美视频在线播放 | 日本天堂在线播放 |