What's the catch?
有什麼貓膩?
What's the catch?
有什麼貓膩?
昨天久違的跟大學同學吃飯,我們約在《創義麵(忠孝)》這間店,義大利麵的價位落在 200-300 之間,應該算是非常平價吧。
我點了一盤墨西哥雞肉麵,原本沒有特別期待,結果竟然第一次吃到所謂「Al Dente(彈牙)」的麵,整個嚇到吃手手!
以前常常在網路上聽人家講說麵要煮到彈牙,一直不知道是什麼意思,想說哪有那麼誇張,結果真的吃到之後才發現差這麼多!
以上就是一個整天吃 7-11、沒見過什麼世面的人,大驚小怪的分享,謝謝。
我發現自己普遍會傾向覺得一樣東西好吃欸?很少會覺得有東西難吃的,標準很低(read:不懂得生活)。
這種容易滿足的個性,應該是會過得還滿快樂的,理論上 :P
讀到了 Shuo-jen 大大的《我的專屬 IMDB 排名》這篇文章,以及 Alex Hsu 大大的留言,才想到我以前也做過類似的事情耶!(現已荒廢)
但我當時打分數的方式只有用 1-5 顆星,優點是簡單快速,不會猶豫個半天,缺點是沒什麼參考價值。
改成用 IMDb 的 10 分制(刻度為 0.5),感覺會是比較好的做法,不會精細到難以抉擇,又有一定的參考價值。
我想了想,幫自己看過的電影打分數,大概有以下幾個好處:
你可以在「IMDb 資料集」裡面找到各種電影資訊。
甚至可以將結果做成「類型喜好圖」或統計表。(當然是叫 AI 幫你做!)
利用「z-score 排序」找出你私心喜歡/不喜歡的電影,這比單純的分數排序更有價值,可以幫你發現那些「大眾覺得普通,但你超愛」的作品!
| 電影 | 你的評分 | IMDb 平均 | 差值 | z-score | 可能的解讀 |
|---|---|---|---|---|---|
| A | 9.0 | 8.5 | +0.5 | -0.2 | 沒有特別偏好 |
| B | 8.0 | 7.0 | +1.0 | +1.3 | 私心推薦 |
| C | 7.0 | 6.8 | +0.2 | -1.1 | 相對不太喜歡 |
註:這裡的 z-score 是以「個人評分與 IMDb 的差值」為樣本計算。
這樣就可以排除掉「給分比較大方」或是「阿嶽真的很嚴格」的系統性偏差,抓出真正的喜好極端值。
| z-score 區間 | 解讀角度 |
|---|---|
| 大於 +1.0 | 你的獨特真愛,比起大眾你更懂得它的好 |
| 介於 -1.0 至 +1.0 | 你的看法跟大眾差不多,表現符合預期 |
| 小於 -1.0 | 你覺得這部片有點過譽了,沒有那麼好 |
我去查了一下,發現 IMDb 有提到他們是怎麼推薦電影的。(連結)
"When you give a movie a positive rating or add a movie to your Watchlist, we track that as a movie that you are interested in and then compare your data to ratings made by other IMDb users."
"We can then find movies and TV shows that people with similar tastes to you like. For each recommendation, you can see a list of the movies or TV shows upon which the recommendation was based."
"You have either rated these titles highly, or added them to your Watchlist."
當你給一部電影好評,或把電影加到你的「片單」裡,我們就會記錄下來,當作你感興趣的電影,然後把你的資料跟其他 IMDb 使用者的評分做比較。
接著,我們可以找出口味跟你相似的人喜歡的電影和影集。每個推薦都會告訴你,是基於哪些電影或影集才推薦給你的。
這些作品都是你評分高的,或者已經加到你的「片單」裡的。
所以呢,去辦一個帳號,幫電影打分數(越多越好),系統就會自動找到與你口味相似的那群人,進而推薦給你「符合口味」的好電影。
(啊,對,我懶懶病,自己沒辦帳號,還叫別人去辦...XD)
《Among Friends》是 Joshua Lee Turner 的一個 YouTube 影片企劃。
Josh 和他的太太 Kelly 會親自飛去跟世界各地的音樂人碰面(見網友),他們會一起挑一首歌、排練、然後現場錄一個合作演出。
這個系列的核心精神是「回歸早期網路那種真誠、人與人之間真實連結的感覺」。
"I don't care what the algorithm wants to hear."
"These are the songs that I want to play, and these are the people that I want to play them with."
演出結束後,他們會訪問這位朋友:
"Who needs an algorithm? Discover music from real people!"
這個編輯真是太讚了,光是開頭就被 ASMR 到不行,特別推薦給喜歡懷舊風的朋友。(人類演算法!)
回想起來,我以前玩各種線上遊戲時也常常會去見網友呢,真是懷念啊~
你好啊,這位朋友!
我現在正在練習「倒立」,但是我又很想滑手機。
可以請你幫我扶一下手機嗎?
🙃
平常在外面,我常常覺得自己需要擺出一副「大人的姿勢」。
走在路上或排隊買東西時,我常有的內心戲是:「哇,那個人看起來好『大人』喔!」。明明自己早就成年了,但我很早就發現,我無法在「自然的狀態下」表現得像個大人。
照理來說(這是一個很容易被炎上的歪理),現在的趨勢應該是:大家的心智都越來越晚熟、一代比一代更不像大人才對。但奇怪的是,我在路上看到大多數的成年人,似乎在「自然的狀態下」就散發著大人的氣息,完全不像我是靠演技撐起來的。
也許是小時候看了 TED 演講《姿勢決定你是誰》,或是看了《生存的 12 條法則》這本書,一直想著「要學龍蝦抬頭挺胸,增加他媽的血清素」,所以「演得像個大人」就成了我在外面的預設動作。
例如:在超商買咖啡的時候,我常常需要故意把肢體放得開一點,像是插腰、站個三七步什麼的,想說總有一天會「Fake it till you make it」,但實踐了這麼多年,感覺一點屁用也沒有,只會越裝越滑稽!
不過我也觀察到,那些 40 歲以上的人,無論是內心還是外表,似乎都有種「本來就是大人」的底氣,即便肢體語言比較縮一點,看起來也還是很從容、很大人。
所以,好像也不用擔心那麼多,再老一點自然就會解決了?
隨便啦,根本就沒有人在乎,去他的聚光燈效應、冒牌者症候群,我就幼稚啦,e04。
週末的時候,我又進入了一種看 YouTube 看到進入心流(Flow)的狀態。
整個過程大概是這樣:
這是一種「探索式」的上網體驗,完全沉浸在影片的世界裡。即使花了三、四個小時在看影片,也不覺得是在浪費時間,反而會感到很滿足,一點也不覺得空虛。
而「YouTube 首頁推薦」就幾乎不會有這種體驗,看久了只會覺得「我剛剛都看了啥?」。訂閱內容還好,因為是自己選的頻道,但也比較少出現這種強烈的沉浸感。
我其實分不太清楚,明明用的是類似的技術,體驗卻截然不同,差別到底在哪?
探索式的體驗,通常會有一個明確的起點。也許是一個搜尋關鍵字,或者是一個想了解的主題,然後一步一步自己選擇下一部影片。
這會讓人主觀上覺得「我有在做決定」,而不是完全的「被引導」,即使這是一種「被安排好的驚喜」。
推薦仍然存在,但它比較像是在延伸我已經在走的方向,而不是替我決定方向。
推播式的體驗則相反,一打開平台,系統就直接開始餵內容。
我沒有先決定想看什麼,而是由系統根據我過去的行為,或者我訂閱的頻道,自動生成一條內容流。
沒有明確的目的地,也沒有清楚的路徑,只有不斷延續的下一個,越看越空虛。
兩者都有「意外發現」的成份,但性質好像不太一樣。
探索時的發現,通常不會太偏離原本的主題,是在某個脈絡之內的延伸;被推播的發現,則更容易把人帶往完全不相干的地方,感覺比較像是被塞東西、被偷走注意力。
探索比較接近一種「漂移」的狀態:不是照著計劃走,也不是被帶著走,而是邊走邊決定方向;推播則是路徑大致已經被設計好,人只是在上面前進。
那麼,我上禮拜做的「相關文章 」功能,它算是探索還是推播呢?
如果你看完文章後,有了一個想了解的主題,那相關文章就只是在延伸這條脈絡,應該比較偏探索。
不過,如果相關文章的標題開始變得越來越聳動、主題越來越跳,甚至優先考慮「點擊率」而不是「相關內容」,那就會慢慢往推播靠近。
也許關鍵不是有沒有推薦,而在於:它是給你探索的靈感,還是想直接牽著你的鼻子走?
I can't get enough of Irish dancing videos!
(不知道為什麼,看英文的影片就會想打英文,打錯就算了 XD)
人生第一罐凡士林!
以前常常看到它,但一直不知道是什麼東西。
薄薄一層塗在皮膚乾裂的地方,能防止水分流失,溫和又有效。
我眼皮乾裂的問題瞬間迎刃而解,真是相見恨晚!
最近因為 PFAS 禁令的關係,Oral-B Glide 系列跌落神壇,也買不到什麼 PTFE 材質的牙線了。
雖然家裡還有不少庫存,不過也要開始來找替代品了。
部落格文章有個特性:可以在文章內插入超連結,串聯到自己過去寫過的文章,或者像 Jaron 一樣整理成「延伸閱讀」。
我自己也會這樣做(又是被 Wiwi 影響),每次寫到一半,想到以前寫過相關文章,就會跑去搜尋欄查一下,再手動把網址貼回來。不過這也只限於「有印象」且「剛好想到」的時候,隨著文章越寫越多、時間久了,有時候連自己寫過什麼都快忘了。
在這種情境下,其實我們可以藉助 AI 的「語義理解」來幫忙找出相似文章哦,先來看看效果吧!
| 相關文章 | 相似度 |
|---|---|
| 網站改版:DIY 靜態網站生成器 | 89% |
| RSS Feed | 86% |
| DIY 網站留言簿 | 86% |
| Bear Blog ʕ•ᴥ•ʔ | 85% |
| 部落格問題挑戰 | 84% |
| 相關文章 | 相似度 |
|---|---|
| 使用 YouTube 聽音樂 | 85% |
| DJ SET | 83% |
| MP3 網頁播放器 | 83% |
| YouTube 歌單備份 | 83% |
| 網路曾經只是生活中的一部分 | 82% |
以下這兩個連結有完整的清單,有興趣的話可以去看一下。
第一步:收集文章資訊當作輸入:比如標題、內文、大綱、分類等等。我這邊是使用「標題」和「內文」。(因為我懶得幫文章加標籤跟摘要)
第二步:透過 AI 模型把文章轉換成語義向量(Embedding)。這段向量可以理解為:AI 模型把文章的「意思」壓縮成了一組數字。兩篇文章如果語義相近,它們在向量空間中的距離也會很接近。
第三步:有了所有文章的向量之後,計算它們彼此之間的餘弦相似度,由高到低排序取前幾名,就是「相關文章」了。
可以到 Google AI Studio 申請一組 API Key(免費),然後把文章內容透過 API 丟給 gemini-embedding-001 模型就能得到語義向量了,(教學文檔)。
需要注意的是免費方案有速率限制,我的做法是每篇擷取前 2000 字(小廢文哪來的 2000 字),每隔兩秒呼叫一次,每天最多可以呼叫 1000 次(依官方為準)。
如果不想依賴外部 API,也可以用 BGE-M3 這個開源的 Embedding 模型,透過 Ollama 在本機跑,完全離線、免費,而且用 CPU 就能順順跑。
Python 版的大致流程如下:
ollama pull bge-m3pip install ollamaollama 套件呼叫 BGE-M3 模型,輸入文章內容,獲得語義向量有了所有文章的語義向量之後,計算每篇文章之間的餘弦相似度(越接近 1 代表語義越相近),接著對每篇文章做排序後取前幾名,就可以得到推薦清單了。
我這邊用 Hash(標題+內文) 的方式來判斷文章是否有改變,只要文章內容沒有改變,就不需要重新計算向量。
相似度的計算目前還是全部重跑一次(讓新、舊文章之間可以互相連結),我自己實測一百多篇大概要跑三秒,還可以接受。
如果你的文章很多的話,可以考慮使用 Vector DB,或者只針對「新文章 vs 舊文章」做增量計算就好。
related.json,前端直接讀取渲染,或者生成靜態的 HTML 區塊。{標題}{標題}{分類}{內文},這個做法簡單又有效。最近注意到 YouTube 網頁版的訂閱頁面 (/feed/subscriptions) 介面變了,原本只有「最新影片」一個區塊,現在則是變成這樣:
「最相關」→「Shorts」→「最新影片」
這代表說,即使是你自己訂閱的頻道,也可能會有資訊過載的問題,而演算法可以幫你破除選擇障礙(?)
畢竟每個油土伯都會叫你「訂閱、按讚、分享」嘛,看得完才有鬼。
我目前每天抓取訂閱內容的兩大主要來源就是「YouTube」和「RSS 閱讀器」。
根據訂閱內容,我覺得可以分成兩種消費模式:
這兩種其實沒有誰比較好,而是要看適不適合你的心理結構。有些人看到很多資訊會覺得自由、可能性多;有些人則會覺得壓力大、永遠看不完。
嗯...我亂取的,反正你懂我的意思,就是「Joy of Missing Out」 vs 「Fear of Missing Out」。
我很明顯是 FOMO 派的,現在的網路環境很容易把人推向快速掃描、跳來跳去的狀態。
如果資訊太多,我常常會想要去清除那個「未讀數」(即使沒顯示),結果就是每次都大量、快速的瀏覽,卻很少真正消化,整個多巴胺的消費都變得很廉價。
而減少資訊量之後,我就可以慢慢讀、停下來思考、或者記住內容。當輸入的內容變少了,獲得的滿足感反而變得更多、更深層。
我在之前的「這篇文章」有提到一種主題分類法:
我依然覺得這是個不錯的方法,但問題是我太貪心了,每次第一類的訂閱數都會膨脹到無限大。
我每年都有賣二手書的習慣,其實這是一樣的道理。
有些人喜歡多留書,想到的時候隨時可以拿出來翻;有些人則是偏向極簡主義,會用「容器」的概念來限制數量。例如:書架最多就只能放 30 本書,想增加一本書或一個訂閱源,就必須要移除一個舊的,這會逼自己不斷優化自己的「口袋名單」。
講這麼多,我只是想說:「十幾個,就夠了」,我也是這麼覺得。
好啦,我要去整理我的書櫃了,這不代表書有什麼問題,只是我的書櫃擺不下了。
題外話:「Wiwi 百科」真的好用。