用戶畫像(英文:User portrait)是一套全面關于用戶信息的標簽,給公司提供決策(商業業務的分析)。用戶畫像最初是在電商領域得到應用的,阿蘭·庫珀(Alan cooper)在1999年提出了用戶畫像的概念。隨著大數據時代的到來,用戶畫像開始逐漸在各方面領域應用,從根據用戶本人的需求開發,轉變為以搜集用戶數據進行分析而進行開發。
用戶畫像的原理是,制定一套全面代替“人”的標簽,進而代替用戶,預測用戶喜歡的內容。用戶畫像是真實用戶的虛擬代表,基于真實數據形成不同類型的用戶畫像,一個產品通常需要4-8種類型的用戶畫像。用戶畫像的標簽類型分為統計類標簽、規則類標簽和機器學習挖掘標簽3大類。用戶畫像的PERSONAL八要素包括:P代表基本性(Primary),E代表同理性(Empathy),R代表真實性(Realistic),S代表獨特性(Singular),O代表目標性(Objectives),N代表數量性(Number),A代表應用性(Applicable),L代表長久性(Long)。
用戶畫像是利用大數據技術對不同類型的人群的進行分析,并為這些人提供出個性化服務,同時給企業帶來商業價值。用戶畫像的應用產生的影響呈現兩極分化。一方面用戶畫像應用于服務業、教育、公共服務和制造業供應鏈等等正面影響方面。另一方面有信息泄露、信息繭房等產生的負面影響。
起源
用戶畫像最早是美國人阿蘭·庫珀(Alan cooper)在1999年Inmates Are Running the Asylum, the Why High-Tech Products Drive Us Crazy and How to Restore the Sanity的初版提出的。他在應用用戶畫像時,將用戶分為不同類型,并利用行為、性別和偏好等要素對用戶進行描述,形成真實用戶的虛擬代表,這種用戶畫像被稱作“User Persona”。這是一種定性研究方法,能夠直接將用戶的核心訴求展現出來。
大數據(Big 數據)時代到來之前,大數據是指信息爆炸時代產生的海量數據。這開辟了新的市場,企業積累了大量的用戶數據,企業以前的技術無法滿足實現精準的用戶需求的服務模式,用戶畫像為解決這種難題而被提出。用戶畫像的定義是一個演變的過程。但隨著“大數據”時代的到來,開發一款軟件,從根據用戶本人的需求開發,轉變為以搜集用戶數據進行分析而進行開發,(定義為標簽作為用戶的特征標識,通過標簽描述用戶),這種用戶畫像稱為 “User Profile”,這屬于數據驅動的定量研究。“User 人格面具”和 “User Profile”雖然表述不一樣,但基本內涵一樣。隨著大數據發展,統計方法在用戶畫像中的應用研究占有重要位置,逐漸在各方面領域應用。
標簽類型
用戶畫像標簽化既方便人理解,又方便計算機的處理。因搜集的數據同時也受時間、地點限性的影響,可以分為動態標簽和靜態標簽。用戶畫像的數據根據應用實際,又可以分為一級標簽和二級標簽(如省包含市)。但一般情況下,用戶畫像的標簽分為統計類標簽、規則類標簽和機器學習挖掘標簽,其中前兩類占開發應用的比例較大。用戶畫像的標簽化初步制定后,再進行評估用戶畫像的標簽的合理性,不合理的標簽進行更改,合理的采用。
統計類標簽
統計類標簽是對用戶畫像的數據進行分類的統計標簽,也是最基礎、最常見的用戶畫像標簽。如性別、年齡和地區等。地區類標簽又可以包含二級標簽。通過這些基礎的用戶畫像標簽,軟件公司就可以統計,性別比例、年齡比例和地區分類等,為用戶畫像的建立做前期的準備。
規則類標簽
規則類標簽是根據用戶畫像的數據中用戶的歷史行為,結合特定的規則而確立的。例如在進行統計消費信息時,將一月內“消費次數>2”,統計成“高次數消費人群”標簽。
機器學習挖掘標簽
機器學習挖掘標簽,主要應用于用戶畫像的需求預測,開發難度大、周期長。如根據已有的用戶畫像數據,進行預測用戶的喜好,又或者進行視頻推薦,這就達到了建立用戶畫像的最終目的,即商業目的。
應用
用戶畫像是開發軟件中的一項技術。用戶畫像的落地應用,公司要提前準備相關工作,然后應用用戶畫像技術等技術,最后進行后續工作。
應用場景
用戶畫像具體應用的方面除了上述以外,還可以應用在服務業如視頻推薦,教育方面如預防惡性校園貸和人才培養等方面。也可以應用在公共服務和制造業供應鏈等等方面。
這里以視頻推薦、預防惡性校園貸和人才培養舉三個應用方面例子。視頻推薦:帶來用戶滿意度高的推薦。以抖音為例,抖音用戶的黏性高,以“娛樂消遣”為主要的內容,生活類、搞笑類視頻更受歡迎,對視頻也更為接受。預防惡性校園貸:如脫離父母管控,沒有能力還款的大學生,容易在不合法平臺,開始貸款。這項技術可以,警示學校關注重點人群,做到事前把控。人才培養:可以為圖書館一直全新的服務,擴寬思路,為學校人才培養提供服務。
用戶畫像開發及涉及技術流程,以抖音APP建立為例,首先建立數據庫用來儲存信息。其次搜集信息,抖音首先關注用戶歷史瀏覽偏好、使用環境,以及年齡、職業、性別等人口統計學特征。關注用戶的行為反饋,如點擊、觀看、收藏、評論。再進行上傳,以達到搜集數據。然后進行用戶畫像的數據分析,首先要進行刪除無關的數據(降維),然后制定標簽,拿抖音用來“消遣”的動機占比高達93.68%,其次是“社交”和“學習”,再進行細分,“生活類”“搞笑類”視頻更加受歡迎,這些標簽用來分類,并把這些數據進行儲存,然后根據新發布的視頻按標簽分類,推薦給不同用戶畫像類型相同的人們,這些數據同樣也要搜集,抖音再拿這些數據進行分析,并進行算法的優化,這些分析報告抖音也會發布出來,如抖音生活服務2022酒旅專題報告,從用戶對抖音的用戶畫像算法推薦的視頻接受度較高,這也造成了導致用戶沉溺。
開發與技術
準備
用戶畫像是在搜集軟件公司搜集完用戶數據,對用戶進行分析的一項技術。在進行用戶畫像分析前,公司要做些準備工作,首先需要建立服務平臺,給用戶提供服務,同時進行管理(搜集、存儲)數據。其次,公司需要簡單統計數據,以及可視化操作。然后公司進行用戶畫像的數據分析。
涉及技術
公司開始利用用戶畫像、用戶行為分析等技術,為進行個性化的推薦做準備。
搜集和存儲
用戶畫像的數據的搜集技術包括爬行綱技術,這是為用戶畫像提供原始素材。搜集的數據同時也受時間、地點限制的影響,因此需要建立動態的搜集數據。用戶畫像的數據需要用數據庫儲存。
數據分析
用戶畫像的數據分析類技術包括降維、標簽制定和判定、分類、數據架構建立和知識的推理(預測)。降維,指處理用戶畫像數據之前,還需要刪除無用的信息,如一些語氣詞“的、了”。標簽制定和判定,用戶畫像建模其實就是對用戶“打標簽”,例如根據不同的標簽的重要性,進行數學計算,如喜歡“喜劇電影“的人多,就把“喜劇電影”單獨作為一個標簽。
分類被認為是數據分析的最基本形式之一,例如把喜歡相同內容的人歸類。數據架構建立包括進行分類儲存、調度數據,如把喜歡喜劇的人的數據,創建命名“喜劇”的數據庫里,也方便以后的“拿取”。知識的推理(預測喜歡什么),可根據已知的用戶畫像數據,推薦給用戶可能喜歡的內容,如一部“喜劇”的電影,可以推薦給用戶畫像標簽為“喜歡喜劇”的人們。
可視化
用戶畫像的數據體現包括可視化技術。可視化可以幫助人們做決策,可以體現某一部分變量和指標對人們有用。主要有基本圖(條形圖、折線圖和散點圖)、分布圖(箱形圖和直方圖),還有交互式可視化圖像,以及具有特殊結構(分層、網絡和地理)的數據的專用圖,如應用于商業業務的分析,視頻平臺公司可以制作詞云來表達用戶對高分電影的偏好,如圖例。
此外可視化還應用于政務數據、無人服務臺、監督和智慧校園等方面。
開發
在進行完用戶畫像分析后,公司進行后續工作,公司管理層進行決策,選出運行策略。然后開發軟件,公司首先確定服務的人群。其次把任務分解給不同部門,并進行市場調研。然后,公司內部人員討論問題并確定需求。最后,公司進行開發測試軟件。
影響
正面影響
服務產業
用戶畫像可以幫助公司更好地掌握用戶偏好,優化產品,制定運營策略,為用戶提供更有針對性的服務。例如算法推薦機制,可以在海量數據中實現內容精準分發,也擴大了用戶以低成本接觸信息的范圍,公司也實現個性化服務,同時通過發布廣告來進行營收,這便提高了公司的生存能力、競爭力和營收能力等等。
教育
除了上述方面,還包括基于用戶畫像技術設計的知識圖譜,更加全面反映人對知識掌握情況,這種數據結構也便于被機器理解。知識圖譜提供了一種組織、 管理和理解海量用戶信息的方法,進一步完善用戶畫像體系,這也降低了更新迭代成本。這便可以幫助人們更好的掌握知識,去進行個性化學習。
公共服務
通信
用戶畫像可以幫助基站的建設,提供更好的通信服務質量。如,先收集撥打時間、基站坐標和網絡請求時間等等,然后建立不同的位置的通信用戶畫像,這些數據也可以推測出用戶的工作方式、 住家地點、工作地點、生活規律、出行方式等等方面,提供更好的通信服務。
水、電、氣
通過用戶畫像技術建立智慧水務平臺、電力調度平臺和燃氣決策平臺。這也是通過先收集不同地區,不同用戶的使用數據,然后建立不同地區、不同用戶的大小標簽,進行資源調度,滿足人們的資源需求。
防詐騙
用戶畫像應用于防詐騙,根據搜集到的被詐騙對象進行標簽制定,制定出的統計類標簽“性別、年齡比例”,根據統計,標簽為“男性、青年”被詐騙的多,進一步根據搜集到的數據,預測可能被詐騙的人群的用戶畫像,進行防詐騙預警。
負面影響
信息繭房
軟件公司在設計推薦系統時,利用用戶畫像技術,為用戶提供精準的服務,加之用戶對這些服務有需求,用戶于是便將自己禁在這樣的“信息繭房”。
2006年,凱斯·桑斯坦教授的《信息烏托邦》提出,指讓人感興趣的信息如“蠶絲”,人們把自己用“蠶絲”包裹起來,用戶沉迷其中,并以此產生的相關技術。相關理論有“回聲室效應”和“過濾氣泡”。回聲室效應,不僅包含信息繭房,還涉及公眾媒體發布的同質化信息,影響了公眾對于事件信息的準確的認知與判斷。過濾氣泡,是在信息繭房和回聲室效應的結合升級形態,同時包含群體極化效應,即群體觀點便是“主流觀點”。
使用用戶畫像等技術設計的推薦系統,青少年在這些被設計的系統內,容易被其內容吸引,耗費了不少時間、精力,在這一過程中,青少年易與家人產生糾紛。
信息泄露
因為用戶畫像的應用首先需要搜集個人信息。而用戶畫像的建立過程中,都有個人隱私的保護問題。2021年11月1日《中華人民共和國個人信息保護法》正式施行。保護信息不被泄露,這需要人們的共同遵守。相關的事件有臉書數據門、學生信息泄露和消費者信息泄露等。
相關事件
臉書(facebook)數據門
2018年3月,臉書“數據門”事件被爆出來并引出反響,Facebook收集了5000萬用戶的個人用戶信息記錄,并賣出這些信息。2016年,臉書為了幫助唐納德·特朗普競選總統,用臉書搜集信息,分析眾多的美國選民的心理特征和個人愛好,進而幫助其競選總統。美國、英國和歐洲的議員們要求展開調查,由此,臉書公司陷入“數據門”,受到了多起官司,臉書被罰款50萬英鎊,但用戶使用該平臺的頻率并未減少。
短信推銷
某些應用程序強制收取用戶信息,并進行用戶畫像分析,向用戶發送營銷短信。這類軟件強制要求輸入“職業”“學習目的”等項,才能登錄頁面。用戶向法院起訴這類APP,說這一行為屬于強制收集用戶畫像信息,法院查明,該應用程序確實有這類行為,遂判處軟件運營商刪除個人信息并停止該行為,并向用戶賠禮道歉并賠償維權所產生的費用。
參考資料 >
教育是信息繭房的解藥.今日頭條.2023-02-05
信息繭房如何“破防”.今日頭條.2023-02-05
德國擬勒令臉書停止收集部分用戶數據.今日頭條.2023-02-05
算數報告 洞察報告 - 逆勢創新 多元生長——抖音生活服務2022酒旅專題報告.巨量算數.2023-02-16
政務數據可視化.今日頭條.2023-02-05
走進可視化無人服務廳.今日頭條.2023-02-05
監督可視化 預警促落實.今日頭條.2023-02-05
智慧校園的數據可視化.今日頭條.2023-02-05
警惕陷入“信息繭房”.今日頭條.2023-02-05
學生信息泄露何時休.今日頭條.2023-02-05
消費者信息泄露問題堪憂.今日頭條.2023-02-05
臉書數據泄露敲警鐘 網絡時代警惕數據濫用-中國科技網 .中國科技網.2023-02-05
臉書深陷“數據門”扎克伯格首度回應.今日頭條.2023-02-05
臉書再陷隱私連環“官司門”.今日頭條.2023-02-05
“數據門”后臉書使用量未減 部分人使用頻率增加.今日頭條.2023-02-05
軟件運營商強制收集用戶畫像被判侵權.今日頭條.2023-02-05