本文來自微信公眾號刷關鍵詞排名y原理3:王智遠(ID:Z201440),作者:王智遠,頭圖來自:視覺中國
早上好王先生:您的體溫是38.3攝氏度,體溫不正常建議去醫(yī)院檢查;昨天晚上您睡6個小時35分鐘,當中醒來3次;其中深度睡眠時間2個小時30分鐘,最近注意各項指標.......
上述聲音來自我家智能管控系統(tǒng)和手環(huán)的反饋,好像把我的生活安排得明明白白,讓我又竊喜又憂愁,為什么刷關鍵詞排名y原理3?
竊喜的是我可以隨時知道身體數(shù)據(jù),及時調整狀態(tài);憂愁的是“我對智能系統(tǒng)的依賴慢慢喪失了某些大腦能力”,事情只是如此簡單嗎?不是的。
如果我告訴你,我們的職業(yè)和人生選擇都被塞進了可被預知的黑匣子中,你會相信嗎?也許多數(shù)人都對這句話有些茫然,不妨來具體看下:
不僅是青年,現(xiàn)在的老人和孩子在閑暇時都喜歡抱著手機刷個不停,形容難聽點是“像中毒了一樣”。
大量的信息流平臺正在通過算法偏好來迎合我們,向我們投喂相似的內容,它會造成什么呢?
一方面會讓自身固定在某個信息圈子中難以逃出,它持續(xù)強化你對某些問題的看法,最后形成價值觀。
另一方面信息堆積越多,注意力就難以集中在那些復雜的問題上,造成判斷力下降。
除此以外,身邊的一切智能設備仿佛也都在嘗試主動為你“提供服務”,這不是壞事;但有一些會讓我們在不知不覺中陷入信息繭房。
一、信息繭房
我們先來看看它的由來。
2001年美國學者凱斯·桑斯坦(Cass R. Sunstein)在《信息烏托邦——眾人如何生產(chǎn)知識》中提出此概念,并針對內容做出分析和討論,具體指:
人們在信息領域會習慣地被自身的興趣所引導,從而將生活桎梏于像蠶絲般一樣的“繭房”中的現(xiàn)象。
這個詞匯的源頭可以追溯到一本新聞傳播專業(yè)考研必讀的書籍,美國計算機科學家、麻省理工學院教授,尼葛洛龐帝的《數(shù)字化生存》。
要知道,20世紀90年代中后期,中國開始興起互聯(lián)網(wǎng)創(chuàng)業(yè)大潮,年輕的互聯(lián)網(wǎng)創(chuàng)業(yè)者們紛紛有感機遇來臨,但對能否把握住這份機遇卻心存忐忑,該書的出現(xiàn)猶如“盲人指路”,被奉為互聯(lián)網(wǎng)時代的“指路圣經(jīng)”。
令人驚訝的是:25年后的今天再打開這本書,會發(fā)現(xiàn)書中的多半描述已經(jīng)成為現(xiàn)實,主要圍繞三個階段的預言:1)從原子到比特,2)代理人界面,3)后信息時代。
第一階段:
我想,上過初中三年級的人應該都熟悉,原子是化學變化中最小的微粒;如果你不懂也沒關系,可以用文科的方式理解:
世界萬物都是由原子構成,原子組合構成分子,分子就像瓦磚,堆成各種物質。
它也是人類最經(jīng)典且使用最廣泛的基礎假設,用來精準地解釋物理學中的力學、熱力學、光學、量子學等多方面的問題,甚至還能解釋自然科學中的生物學等等。
而尼葛洛龐帝看來,上世紀90年代,大多數(shù)信息都是以“原子”的形式呈現(xiàn),例如錄像帶、雜志、報紙和書籍,長期以來大家對此也習以為常。
但隨著計算機技術的發(fā)展,即時的電子數(shù)據(jù)傳輸就會成為主流的傳播方式,我們進而進入比特(binary digit,簡稱BIT)組成的世界。
原因在于比特是信息的最小單位,它沒有重量,能快速傳播,拷貝無需成本,并且不會被區(qū)域所隔。
這種新的方式能幫助信息擺脫時空的限制,成為全球共享資源,為各個領域的發(fā)展帶來便利,同時也能促進互聯(lián)網(wǎng)和計算機的普及。
第二階段:
在上世紀90年代美國計算機學界還是程序設計語言、操作系統(tǒng)和網(wǎng)絡協(xié)議天下時,尼葛洛龐帝召集一幫各領域專家創(chuàng)立了一家名為“媒體實驗室”的機構,聚焦研究人機互動。
當時人們把計算機研究重點放在“人如何使用它”,并沒有關注“如何和計算機更好地相處”。
而基于此問題,他又提出一個新的概念:“計算機設計需要人性化界面、此界面應該是使用人代理模式”。
計算機界面必須像你的管家助手那樣能夠認識你,了解你的愛好、品位、傾向與需求;甚至還要知曉你的社交朋友圈、理解你的表達語言和肢體動作。
因此,尼葛洛龐帝認為觸屏技術、眼球追蹤、語言識別甚至互聯(lián)網(wǎng)人格的相關研究會是大趨所勢,目前看來這些在現(xiàn)在均已經(jīng)實現(xiàn)。
第三階段:
尼葛洛龐帝在上述基礎上,進一步設想了智能計算機將為人類生活帶來巨大改變。
他預言,互聯(lián)網(wǎng)會進入“極端個人化的信息時代”,即算法推薦;在后信息時代里,電腦、手機APP會基于它對你的了解為你推薦定制化信息。
從前,大眾媒體把一模一樣的信息通過廣播或電視無差別地推薦給每個人;而未來APP會主動對信息進行篩選,并通過界面為使用者制作獨一無二的“個人摘要”。
那么,如果按照此指導手冊發(fā)展,這意味著什么呢?
這不僅讓我心中一喜,目前買的很多電子設備都不用看使用說明書就可以用“語言、行為”控制它,以后豈不是更方便么?
但尼葛洛龐帝認為,美好未來雖到來,但信息也會在不知不覺中侵蝕人們的智慧和知識;比如:工作機會的減少,導致更多互聯(lián)網(wǎng)創(chuàng)業(yè)者借助線上平臺創(chuàng)造更多知識來與企業(yè)協(xié)同。
這背后意味著復雜的工作交給機器解決,人類創(chuàng)作性工作將很難一步登上山頂,甚至非常優(yōu)秀的創(chuàng)作也很難被發(fā)現(xiàn),因此未來你可能更多的是和“機器”交流。
機器取代大部分人力的潮流必不可當,更加嚴重的是隨著算法推薦帶來的信息繭房和數(shù)字鴻溝,會加深一個人與另一個人的距離感。
比如:你習慣看歷史知識,平臺圍繞歷史中心化展開;若一個天天看娛樂的人被推送的都是八卦,甚至像我這種經(jīng)常搜“學習內容”的人,試想下種種場景會帶來什么后果呢?
我們很難逃出“習慣的周邊三公里”。如果不經(jīng)過主動思考判斷或故意去搜尋,會陷入知識獲取單一化,沒有社會統(tǒng)一認識中,嚴重者還會造成與社會和企業(yè)脫節(jié)。
一個現(xiàn)實的案例是:
我看到很多離職3個月以上的人,與他們溝通就會發(fā)現(xiàn)他們已經(jīng)陷入自身的“信息繭房”,對跨崗一丁點技能還能理解,對跨公司業(yè)務就直接出現(xiàn)“黑匣子狀態(tài)”。
不可否認,我們正在經(jīng)歷尼葛洛龐帝教授第三階段的預測;人們無法阻止數(shù)字化的變化,就像無法對抗大自然一樣;但至少每個人應該了解它是如何形成的,如何一步一步吞噬著人們獨有的思考模式。
當然,這一切背后離不開人們常說的“算法”或者“個性化推薦”,但它并不是罪魁禍首。
二、算法原理
從框架而言,推薦系統(tǒng)一般包含“召回”和“排序”兩方面。
不論是信息還是消費類電商平臺,多半以此類型來訓練用戶,而算法又基于“內容”和“用戶行為”兩大類別展開。
我們知道普通人的思維方式分為兩種類型:
1)線性思維,2)非線性思維”。
前者是把認識停留在對事物的抽象而非本質上,并以這樣的抽象為出發(fā)點,片面、直線地解釋某件事;后者是把認識停留在對事物的抽象層并以此為基石,進而看到底層原理。
機器學習方式和人相似,也分為線性和多種思維(學習)模型,最主要區(qū)別是一方面偏向基礎原理,一方面偏向多元化加工;從專業(yè)角度出發(fā),一共有6種常用方式:
1)過濾算法,2)矩陣算法;3)因子分解機,4)邏輯回歸;5)梯度提升決策樹,6)深度神經(jīng)網(wǎng)絡。
它們用在什么位置呢?
要知道,人們看到的所有信息均展示在APP的首頁或分類上,在推薦系統(tǒng)中它們屬于最上層的展示層,算法屬于中間層,數(shù)據(jù)是最底層;而算法的主要功能就是排序和召回,上述的六種模型均服務它們兩者。
舉個例子:
我們經(jīng)常使用某款APP,它習慣性地抓取自己點擊的每個圖片或者下方的內容,然后用打標簽的方式歸類在后臺中,該行為屬于排序,進一步說平臺可以收集一個賬號的多個標簽排序。
可當你許久沒有打開該APP時,機器就基于你感興趣的內容,通過push,短信的方式召回我們。
大部分大平臺(小紅書、抖音、快手)的推薦系統(tǒng)分人工干預和自動推薦兩種,前者顧名思義人來操作,后者是給機器設定固定時間來循環(huán)使用。
自動推薦是什么呢?
若進一步展開解釋,如監(jiān)督學習算法Y= F(Xi ,Xu ,Xc),這三個函數(shù)包含三個維度的變量分別為:1)內容,2)用戶特征,3)環(huán)境特征。
三者匹配起來是一個復雜的數(shù)學問題;市面常用模型有好幾種,無非是把多模型混合使用,簡單來說就是:你是誰、你在哪里、你愛看什么?基于這些給你推薦內容。
一般當推薦系統(tǒng)的自動化運作時,它就像山頭巡視的小兵,不斷從整個物品或者信息聚合中抽取當次需要查詢的候選集;根據(jù)各種不同維度,如物品、年齡、性別、愛好,場景等種類以及規(guī)模的大小對候選集進行推送。
此場景猶如流水線工作的“抽樣檢查”,也同樣用在大部分平臺的召回手段上,具體策略是怎樣的呢?
其一,內容過濾(Content Filtering)。
其二,協(xié)同過濾(Collaborative Filtering)。
資訊類產(chǎn)品的內容審核是不可缺失的一部分,主要目的是確保無低質庸俗,保持平臺該有的調性;通常有“先發(fā)后審”和“先審后發(fā)”兩個原則。內容抽檢或過濾的基礎是查敏感關鍵詞、重復度、IP發(fā)布次數(shù)等權重指數(shù)。
協(xié)同過濾是基于已知部分用戶或部分物品的偏好或評分,預測缺失偏好或評分的一種方法。
從切入點上,則可分為基于“去鄰域”的方法(本地生活類平臺使用居多)和隱語義模型(給每個分類中不同維度標簽的人進行推送)。
舉個例子:
跟朋友聚餐時打開美食點評平臺去搜索周邊餐廳,過程中我們能看到按照公里排行的推薦、也有部分商家的競價廣告。
疑問的是,你會發(fā)現(xiàn)那些廣告的美食是自己日常愛吃的,并且區(qū)域也不是太遠,為什么會這么做?
因為可以基于“鄰域”做精準的推薦,以此滿足用戶多頻次的消費和深度洞察;如果把“鄰域”比作數(shù)學的“2”,它左手鏈接“1”,右手鏈接數(shù)字“3”。
去鄰域算法就是把“1”推薦給“3”,假設不做去中心化折中結果就是上述你看到場景,基于自己搜索習慣、愛好、距離做折中推薦。
對于人工干預比較容易理解,例如基于某類標簽做手動推送,如:性別類型、興趣愛好、話題、KOL量級等。
高維一點會融會貫通幾項不同的數(shù)據(jù)綜合考量。這種方式常見在中小型(百萬級用戶量)以上的平臺,主要特征表現(xiàn)在技術的基礎建設已經(jīng)完成,屬于發(fā)展中期還不能完全依靠自動化解決。
一方面防止有巨大漏洞出現(xiàn),造成損失。
另一方面也能運用人工的方式靈活多維度地基于用戶(商品)進行推送,比如以點擊率作為推薦指標時,排序算法篩選后,我們會以預測結果為目標。
這些場景中就會用到因子分解,邏輯歸因,梯度提升決策樹,以及各種神經(jīng)網(wǎng)絡算法,因此稱之為“混合模型”。
但不管怎么樣始終都離不開那兩大原則“基于用戶行為”和“基于內容”。
企業(yè)招聘大量研發(fā)人員,利用理科的思維邏輯將人的行為特征“數(shù)據(jù)化”,對數(shù)據(jù)進行顆?;?,最終通過個性化的分析讓平臺更了解每個人,也就有了那句感同身受的話:“我還沒有平臺了解我自己”。
但真的是這樣嗎?這種理解是片面的。
你以為平臺很了解自己?其實我們不過是把愛好,需求形成的特征進行標簽化沉淀在平臺上,造成推薦的內容都在自身的“認知圈內”。
簡而言之,每個人在頭部資訊(購物)平臺看到的展示頁均不同,每個展示頁都代表不同人的視野和愛好,仿佛一面鏡子瘋狂地為你展現(xiàn)熱愛的一面,它帶來的利弊也是顯而易見。
三、孰是孰非
信息繭房的影響有兩個方面:
一是良好的認知能力,二是陷入回音室效應。
如果我們能夠正確認知到信息繭房由何而來,或者算法如何基于自身的各種行為形成“虛擬人設”為你定做線上畫像;加上我們能夠辨別哪些信息是優(yōu)質的,哪些是不能為我所用,那就不存在“繭房”。
這給我們最大的啟示是,很多時候我們聽到的未必都是正確的,只有深入并全面了解才會擺脫困境。
比如:很多人為擺脫算法的囚籠,在平臺閱讀內容時不點贊、不評論、不互動;這就能擺脫它嗎?并不能。
算法反而會為你推薦一大堆亂八七糟的內容,讓你眼花繚亂失去對關鍵信息的辨別的能力。
換句話說,“信息封閉環(huán)境”聽起來是壞事,可實際上,這也是一種很常見的現(xiàn)象。
在沒有互聯(lián)網(wǎng)時,世界上的信息同等無窮盡,新的信息也在產(chǎn)生,舊的信息也從未消失,堆積依然很多;即便人用上一生的精力學習也是有限,真正有所造詣的人都是在冰山上抓住某個角。
何況很多時候,各種娛樂類、偏社交短內容平臺的push大概率是瑣碎事,真正重要的信息你一定會接收到。
假如我們不知道“信息繭房”的概念,可能會形成持續(xù)受害而毫無覺察的狀態(tài),這就容易陷入回音室效應中,它有四個關鍵因素:
1)隔離,2)觀點極致化,3)觀點同質化,4)同樣信息重復傳播。
你可以把它理解成在固有群體或“小圈子”內,幾乎與外界不怎么交流。
由于沒有外部或不同信息進來,內部觀點會在重復傳播中不停地在人們心中鞏固,促使人們看到與內部觀點不同的觀點時盡可能否定,從而達到“極端共鳴”。
舉個例子:
很多人熱愛進不同的付費社群來學習,圈子中往往會強調一種東西叫“價值認同”或“主題認同”,假設某個行為(主題)觸發(fā)大部人群友的愛好或行為底線,那你可能就會被移出群聊。
當所有人的觀點都趨同,那同樣的信息傳播,不同的人去表達,其質量本身并不會提高,對個人的成長也并沒有太大幫助。
這四個關鍵表現(xiàn),很好地解釋了信息與受眾的思維關鍵;具體而言,回音室效應不但可以讓一個人思維禁錮,還極有可能直接廢掉理性思考能力。
根據(jù)調查,很多受害者是這兩類人:一是不乏受過高等教育的專家學者,二是分辨力、自控力不高的人。
前者光學習理論而不實踐,很容易陷入封閉狀態(tài)中,這種原地踏步造成與現(xiàn)實社會脫節(jié),而其還沉浸在固有的圈子中“津津有味”,殊不知外界已經(jīng)發(fā)生了巨大的變化。
后者是那些經(jīng)常以“這樣學習就是對”“哪個專家說”作為標榜或處事依據(jù)的人,他們不習慣以理性的事實為基礎,更容易陷入感性。
正是陷入自己編織的信息繭房之中,才會不停閱讀內容高度重復卻幾乎毫無營養(yǎng)的資訊,這造成自己的認識很難提升到新的層級。
在我看來,所謂的相對封閉環(huán)境,即可以是被動也可以成為主動。
被動是由于別人提供,而主動在于自己,如改變你獲取信息的渠道、屏蔽無效信息、把它們變成高質量信息。
因此我們所避免的信息繭房可能是錯的,“擺脫”不是目的,如何有效的利用它為自身做增值才是最重要的;那如何做呢?有2個認知1個技巧是我在踐行的。
四、三個錦囊
有句話叫做“人無法賺到自身認知之外的錢”,相對的是“人無法碰到自身認知水平之外的問題”,那么,現(xiàn)在碰到的問題就是自己現(xiàn)階段的一個上限,具體改變上你可以進行參考:
1)微調認知基模
基模是人與生俱來的行為模式,會隨著成長而變化。它是一種知識分類體系,呈層次化結構,類似于樹狀圖;一般來說并不以某個具體事例為對象,而具有某種程度的一般化和抽象化的性質。
比如可以將方法論提煉成為規(guī)律,將規(guī)律用在不同領域,它們彼此間都是有關聯(lián)的,只是我們從未發(fā)現(xiàn)。
1973年,美國學者羅伯特·阿克塞爾羅德在《認知與信息處理過程的基模理論》一文中,提出信息處理的過程模式的解釋:
它認為“當我們接觸到一個新的事物或者信息時,我們頭腦中的相關基模就被激活,參與到信息處理的每個環(huán)節(jié)當中”。
進一步說:當信息的各項特征與我們的認知基模相吻合時,人們習慣用原有的解釋和態(tài)度對待它;當不吻合時,才會對新舊信息進行比較,補充新信息確保新解釋和態(tài)度。
如果你認識到就會發(fā)現(xiàn),新信息處理結果對認知基模會產(chǎn)生兩種影響,其一對舊行為認知的強化,假如有矛盾即修正形成新基模;其二新信息的處理,會自己做出分析、推理和判斷。
從發(fā)展來看,只有不斷接觸新信息,認知基模才會發(fā)展出分支或做結構調整,這也符合神經(jīng)心理學中“神經(jīng)元集群(neural ensemble)的解釋”。
2)改善偏食情況
很多人喜歡給自己貼標簽,當然他們都有一套邏輯自洽的理論,我不反對也不贊成;我的心得是“年輕人不要隨意貼標簽”,為什么呢?
標簽會植入到心智中,無形中影響你往哪個圈子發(fā)展、學習什么類型的內容等;這很容易造成“信息偏食”,它會局限自我定位。
有人說聚焦不好嗎?正確的聚焦在我看來先有中長期目標,如結合3年~5年規(guī)劃再看當下。
一方面,人與標簽唯一不同在于前者是動態(tài)發(fā)展的,后者是靜態(tài)呈現(xiàn);今年認為對的,明年可能就會失效。
標簽是手段,假設自身認為某個標簽在短時間能夠讓自己有個質的提高,或通過此力量能帶來外界優(yōu)勢,反而是不錯的選擇。
另一方面,即使通過標簽或圈子滲透到某個領域中,自身也需要對領域的知識有全面的認知,不要盲目地跟隨別人的意見和建議,這樣,受社交媒體下“群體性孤獨”的影響幾率會不斷減少。
那么,對于多元化信息的獲取和構建“多元化”的圈子,都是擺脫信息繭房必要的手段。
3)多看多聽多動手
這句話的意思是“盡可能刪掉自己的歷史瀏覽痕跡”,遇到喜歡的內容把它立馬記錄下來或轉存在收藏中;這可確保自己看到的內容不是被推薦,而是相對隨機的。
此方法的好處是可以立竿見影地起效,壞處是你始終還很難完全避免“被種草”,那怎么辦呢?
多動手去各種平臺獲取信息,并非“多動手點贊”;這樣可以避免單個平臺的誤導;就我個人而言,因為我有閱讀習慣,所以經(jīng)常通過RSS(信息聚合)閱讀當天所有新聞。
古人云:兼聽則明,偏信則暗。當自身做到多渠道、全方位地獲取隨機性的信息時,信息繭房就會失去存在的基礎,自然就會不攻自破。
總而言之,信息繭房仍然是可破解和避免的,主要是積極主動行動起來,放棄固有習慣,這可能會讓自身逃離舒適區(qū),變得不那么愉快;我想,比起收益這點付出還算值得。
總結一下:
最厲害的并不是所謂平臺方“算力”或“數(shù)據(jù)”有多牛,而是人;不信你想想,平臺的技術會磨滅我們看世界的好奇心嗎?
并不會,平臺多元的分發(fā)口徑,沒有成為“繭”,反而織了一張“網(wǎng)”;而讓自身看到的信息成為繭房,或許這件事只有自己能辦到,不是嗎?
本文來自微信公眾號:王智遠(ID:Z201440),作者:王智遠
本內容為作者獨立觀點,不代表虎嗅立場。未經(jīng)允許不得轉載,授權事宜請聯(lián)系 hezuo@huxiu.com
正在改變與想要改變世界的人,都在 虎嗅APP
掃描二維碼推送至手機訪問。
版權聲明:本文由信途科技轉載于網(wǎng)絡,如有侵權聯(lián)系站長刪除。