廢文小天地

隨意分享,隨便看看

幫電影打分數有什麼好處?

讀到了 Shuo-jen 大大的《我的專屬 IMDB 排名》這篇文章,以及 Alex Hsu 大大的留言,才想到我以前也做過類似的事情耶!(現已荒廢)

但我當時打分數的方式只有用 1-5 顆星,優點是簡單快速,不會猶豫個半天,缺點是沒什麼參考價值。

改成用 IMDb 的 10 分制(刻度為 0.5),感覺會是比較好的做法,不會精細到難以抉擇,又有一定的參考價值。

Movie Ratings
▲ 我的影集評分紀錄

我想了想,幫自己看過的電影打分數,大概有以下幾個好處:

1. 分析自己對不同電影類型的喜好

你可以在「IMDb 資料集」裡面找到各種電影資訊。

  • 分析看看自己傾向給哪些類型高分或低分
  • 了解自己偏愛或不感興趣的題材
  • 最喜歡/最常看哪個導演或演員的電影

甚至可以將結果做成「類型喜好圖」或統計表。(當然是叫 AI 幫你做!)

2. 建立個人私藏清單

利用「z-score 排序」找出你私心喜歡/不喜歡的電影,這比單純的分數排序更有價值,可以幫你發現那些「大眾覺得普通,但你超愛」的作品!

舉個栗子:

電影 你的評分 IMDb 平均 差值 z-score 可能的解讀
A 9.0 8.5 +0.5 -0.2 沒有特別偏好
B 8.0 7.0 +1.0 +1.3 私心推薦
C 7.0 6.8 +0.2 -1.1 相對不太喜歡

註:這裡的 z-score 是以「個人評分與 IMDb 的差值」為樣本計算。

這樣就可以排除掉「給分比較大方」或是「阿嶽真的很嚴格」的系統性偏差,抓出真正的喜好極端值。

解讀角度:

z-score 區間 解讀角度
大於 +1.0 你的獨特真愛,比起大眾你更懂得它的好
介於 -1.0 至 +1.0 你的看法跟大眾差不多,表現符合預期
小於 -1.0 你覺得這部片有點過譽了,沒有那麼好

3. 個人化推薦系統

我去查了一下,發現 IMDb 有提到他們是怎麼推薦電影的。(連結

"When you give a movie a positive rating or add a movie to your Watchlist, we track that as a movie that you are interested in and then compare your data to ratings made by other IMDb users."

"We can then find movies and TV shows that people with similar tastes to you like. For each recommendation, you can see a list of the movies or TV shows upon which the recommendation was based."

"You have either rated these titles highly, or added them to your Watchlist."

當你給一部電影好評,或把電影加到你的「片單」裡,我們就會記錄下來,當作你感興趣的電影,然後把你的資料跟其他 IMDb 使用者的評分做比較。

接著,我們可以找出口味跟你相似的人喜歡的電影和影集。每個推薦都會告訴你,是基於哪些電影或影集才推薦給你的。

這些作品都是你評分高的,或者已經加到你的「片單」裡的。

所以呢,去辦一個帳號,幫電影打分數(越多越好),系統就會自動找到與你口味相似的那群人,進而推薦給你「符合口味」的好電影。

(啊,對,我懶懶病,自己沒辦帳號,還叫別人去辦...XD)

推薦影片:Among Friends S2

《Among Friends》是 Joshua Lee Turner 的一個 YouTube 影片企劃。

Josh 和他的太太 Kelly 會親自飛去跟世界各地的音樂人碰面(見網友),他們會一起挑一首歌、排練、然後現場錄一個合作演出。

這個系列的核心精神是「回歸早期網路那種真誠、人與人之間真實連結的感覺」。

"I don't care what the algorithm wants to hear."

"These are the songs that I want to play, and these are the people that I want to play them with."

演出結束後,他們會訪問這位朋友:

  • 推薦一些他們認為被低估或較少人知道的音樂。
  • 推薦一些在地人才知道的地方/景點。
  • 最近做了什麼讓自己和他人產生更多連結?

"Who needs an algorithm? Discover music from real people!"

影片連結

這個編輯真是太讚了,光是開頭就被 ASMR 到不行,特別推薦給喜歡懷舊風的朋友。(人類演算法!)

回想起來,我以前玩各種線上遊戲時也常常會去見網友呢,真是懷念啊~

播放清單

麻煩幫我扶一下手機

你好啊,這位朋友!

我現在正在練習「倒立」,但是我又很想滑手機。

可以請你幫我扶一下手機嗎?

🙃

走路裝 Gang:假裝自己是一隻龍蝦

平常在外面,我常常覺得自己需要擺出一副「大人的姿勢」。

走在路上或排隊買東西時,我常有的內心戲是:「哇,那個人看起來好『大人』喔!」。明明自己早就成年了,但我很早就發現,我無法在「自然的狀態下」表現得像個大人。

照理來說這是一個很容易被炎上的歪理,現在的趨勢應該是:大家的心智都越來越晚熟、一代比一代更不像大人才對。但奇怪的是,我在路上看到大多數的成年人,似乎在「自然的狀態下」就散發著大人的氣息,完全不像我是靠演技撐起來的。

也許是小時候看了 TED 演講《姿勢決定你是誰》,或是看了《生存的 12 條法則》這本書,一直想著「要學龍蝦抬頭挺胸,增加他媽的血清素」,所以「演得像個大人」就成了我在外面的預設動作。

例如:在超商買咖啡的時候,我常常需要故意把肢體放得開一點,像是插腰、站個三七步什麼的,想說總有一天會「Fake it till you make it」,但實踐了這麼多年,感覺一點屁用也沒有,只會越裝越滑稽!

不過我也觀察到,那些 40 歲以上的人,無論是內心還是外表,似乎都有種「本來就是大人」的底氣,即便肢體語言比較縮一點,看起來也還是很從容、很大人

所以,好像也不用擔心那麼多,再老一點自然就會解決了?

隨便啦,根本就沒有人在乎,去他的聚光燈效應、冒牌者症候群,我就幼稚啦,e04。

結論

  • 越想裝大人,就越不像大人。
  • 別人都在養龍蝦,只有我在學龍蝦。

YouTube 探索模式

週末的時候,我又進入了一種看 YouTube 看到進入心流(Flow)的狀態

整個過程大概是這樣:

  1. 先搜尋一個主題或關鍵字,作為探索的起點。
  2. 點開幾部看起來有意思的影片,開始建立初步的脈絡。
  3. 從側邊的相關影片繼續往下挖,沿著同一個方向延伸。
  4. 有時候點進某個頻道,看看頻道還有哪些熱門內容或播放清單。
  5. 看看底下留言區,有沒有更多延伸資訊或不同的觀點。
  6. 發現新東西或是想換角度時,再改一組關鍵字重新搜尋。(有時候會轉戰到 google 與 reddit)

這是一種「探索式」的上網體驗,完全沉浸在影片的世界裡。即使花了三、四個小時在看影片,也不覺得是在浪費時間,反而會感到很滿足,一點也不覺得空虛。

而「YouTube 首頁推薦」就幾乎不會有這種體驗,看久了只會覺得「我剛剛都看了啥?」。訂閱內容還好,因為是自己選的頻道,但也比較少出現這種強烈的沉浸感。

我其實分不太清楚,明明用的是類似的技術,體驗卻截然不同,差別到底在哪?

探索式的體驗

探索式的體驗,通常會有一個明確的起點。也許是一個搜尋關鍵字,或者是一個想了解的主題,然後一步一步自己選擇下一部影片。

這會讓人主觀上覺得「我有在做決定」,而不是完全的「被引導」,即使這是一種「被安排好的驚喜」。

推薦仍然存在,但它比較像是在延伸我已經在走的方向,而不是替我決定方向。

推播式的體驗

推播式的體驗則相反,一打開平台,系統就直接開始餵內容。

我沒有先決定想看什麼,而是由系統根據我過去的行為,或者我訂閱的頻道,自動生成一條內容流。

沒有明確的目的地,也沒有清楚的路徑,只有不斷延續的下一個,越看越空虛。

差別到底在哪?

兩者都有「意外發現」的成份,但性質好像不太一樣。

探索時的發現,通常不會太偏離原本的主題,是在某個脈絡之內的延伸;被推播的發現,則更容易把人帶往完全不相干的地方,感覺比較像是被塞東西、被偷走注意力。

探索比較接近一種「漂移」的狀態:不是照著計劃走,也不是被帶著走,而是邊走邊決定方向;推播則是路徑大致已經被設計好,人只是在上面前進。

部落格的「相關文章」是哪種?

那麼,我上禮拜做的「相關文章 」功能,它算是探索還是推播呢?

如果你看完文章後,有了一個想了解的主題,那相關文章就只是在延伸這條脈絡,應該比較偏探索。

不過,如果相關文章的標題開始變得越來越聳動、主題越來越跳,甚至優先考慮「點擊率」而不是「相關內容」,那就會慢慢往推播靠近。

也許關鍵不是有沒有推薦,而在於:它是給你探索的靈感,還是想直接牽著你的鼻子走?

所以你看了啥?

Irish Dance
▲ I can't stop rewatching this, it's so "Sprezzatura".

I can't get enough of Irish dancing videos!

(不知道為什麼,看英文的影片就會想打英文,打錯就算了 XD)

凡士林&牙線

人生第一罐凡士林!

以前常常看到它,但一直不知道是什麼東西。

薄薄一層塗在皮膚乾裂的地方,能防止水分流失,溫和又有效。

我眼皮乾裂的問題瞬間迎刃而解,真是相見恨晚!

凡士林
▲ 一大罐才 89 塊!

牙線之亂

最近因為 PFAS 禁令的關係,Oral-B Glide 系列跌落神壇,也買不到什麼 PTFE 材質的牙線了。

雖然家裡還有不少庫存,不過也要開始來找替代品了。

DIY 系列:來做個「相關文章」功能

部落格文章有個特性:可以在文章內插入超連結,串聯到自己過去寫過的文章,或者像 Jaron 一樣整理成「延伸閱讀」。

我自己也會這樣做(又是被 Wiwi 影響),每次寫到一半,想到以前寫過相關文章,就會跑去搜尋欄查一下,再手動把網址貼回來。不過這也只限於「有印象」且「剛好想到」的時候,隨著文章越寫越多、時間久了,有時候連自己寫過什麼都快忘了。

在這種情境下,其實我們可以藉助 AI 的「語義理解」來幫忙找出相似文章哦,先來看看效果吧!

網站/部落格

《設計極簡部落格》(原文
相關文章 相似度
網站改版:DIY 靜態網站生成器 89%
RSS Feed 86%
DIY 網站留言簿 86%
Bear Blog ʕ•ᴥ•ʔ 85%
部落格問題挑戰 84%

音樂/播放器

《卡式錄音機》(原文
相關文章 相似度
使用 YouTube 聽音樂 85%
DJ SET 83%
MP3 網頁播放器 83%
YouTube 歌單備份 83%
網路曾經只是生活中的一部分 82%

旅遊/景點

《九份》(原文
相關文章 相似度
貓空纜車 84%
花蓮四日小旅行 83%
YouBike 2.0E 電輔車 82%
不上班ㄉ阿替 82%
逛全聯 81%

以下這兩個連結有完整的清單,有興趣的話可以去看一下。


運作原理

第一步:收集文章資訊當作輸入:比如標題、內文、大綱、分類等等。我這邊是使用「標題」和「內文」。(因為我懶得幫文章加標籤跟摘要

第二步:透過 AI 模型把文章轉換成語義向量(Embedding)。這段向量可以理解為:AI 模型把文章的「意思」壓縮成了一組數字。兩篇文章如果語義相近,它們在向量空間中的距離也會很接近。

第三步:有了所有文章的向量之後,計算它們彼此之間的餘弦相似度,由高到低排序取前幾名,就是「相關文章」了。


兩種 Embedding 方案

方案一:Gemini(API)

可以到 Google AI Studio 申請一組 API Key(免費),然後把文章內容透過 API 丟給 gemini-embedding-001 模型就能得到語義向量了,(教學文檔)。

需要注意的是免費方案有速率限制,我的做法是每篇擷取前 2000 字(小廢文哪來的 2000 字),每隔兩秒呼叫一次,每天最多可以呼叫 1000 次(依官方為準)。

方案二:BGE-M3(本地)

如果不想依賴外部 API,也可以用 BGE-M3 這個開源的 Embedding 模型,透過 Ollama 在本機跑,完全離線、免費,而且用 CPU 就能順順跑。

Python 版的大致流程如下:

  1. 下載 OllamaPython
  2. 下載 BGE-M3 模型:ollama pull bge-m3
  3. 安裝 Python 套件:pip install ollama
  4. 透過 Python 的 ollama 套件呼叫 BGE-M3 模型,輸入文章內容,獲得語義向量

計算相似度與排序

有了所有文章的語義向量之後,計算每篇文章之間的餘弦相似度(越接近 1 代表語義越相近),接著對每篇文章做排序後取前幾名,就可以得到推薦清單了。

快取機制

我這邊用 Hash(標題+內文) 的方式來判斷文章是否有改變,只要文章內容沒有改變,就不需要重新計算向量。

相似度的計算目前還是全部重跑一次(讓新、舊文章之間可以互相連結),我自己實測一百多篇大概要跑三秒,還可以接受。

如果你的文章很多的話,可以考慮使用 Vector DB,或者只針對「新文章 vs 舊文章」做增量計算就好。


完整執行流程

  1. 載入快取,用 Hash 比對找出需要更新的文章。
  2. 清除已刪除文章的舊快取。
  3. 對需要更新的文章做 Embedding 存進快取。
  4. 計算所有文章之間的相似度,由高到低排序,取前 K 名。
  5. 輸出成 related.json,前端直接讀取渲染,或者生成靜態的 HTML 區塊。

小補充

  • 可以加入「時間權重」,讓比較新的文章更容易出現在推薦裡,Bear Blog 也有採用類似的做法。
  • 如果你覺得「標題」、「分類」比較重要的話,可以在餵給 AI 之前多重複幾次關鍵資訊,例如:{標題}{標題}{分類}{內文},這個做法簡單又有效。
  • AI 太精準有時會少了點驚喜,可以對相似度分數加入一點點隨機分數,或者在推薦清單中固定留一個位置給「隨機抽樣」的文章。
  • 這種做法完全不需要收集使用者資訊哦(按讚數、瀏覽數、停留時間等等),純粹是靠文章內容本身的語義來做推薦,對於不喜歡測量的朋友來說還不錯。
  • 雖然功能做好了,但我還在考慮要不要加進網站裡,不然就是當作自己手動插入「延伸閱讀」的參考工具就好。XD

訂閱內容:我的書架不大

最近注意到 YouTube 網頁版的訂閱頁面 /feed/subscriptions 介面變了,原本只有「最新影片」一個區塊,現在則是變成這樣:

「最相關」→「Shorts」→「最新影片」

這代表說,即使是你自己訂閱的頻道,也可能會有資訊過載的問題,而演算法可以幫你破除選擇障礙(?)

畢竟每個油土伯都會叫你「訂閱、按讚、分享」嘛,看得完才有鬼。

你是哪種類型的讀者?

我目前每天抓取訂閱內容的兩大主要來源就是「YouTube」和「RSS 閱讀器」。

根據訂閱內容,我覺得可以分成兩種消費模式:

1. 「輸入多 → 篩選型」

  • 訂閱數很多,每天都會收到大量更新
  • 有自己的一套篩選系統、能夠接受「大部分內容不看」
  • 依靠快速掃描來消費資訊(影片的話就是開兩倍速)
  • 喜歡掌握大範圍的最新資訊

2. 「輸入少 → 滿足型」

  • 訂閱數較少,每天只會收到少量更新
  • 不需要做太多的篩選,有時間看完訂閱內容
  • 看得慢、看得深,偶爾會停下來思考,印象也會比較深
  • 眼不見為淨,比較少焦慮

這兩種其實沒有誰比較好,而是要看適不適合你的心理結構。有些人看到很多資訊會覺得自由、可能性多;有些人則會覺得壓力大、永遠看不完。

「JOMO 派」 vs 「FOMO 派」!

嗯...我亂取的,反正你懂我的意思,就是「Joy of Missing Out」 vs 「Fear of Missing Out」。

我很明顯是 FOMO 派的,現在的網路環境很容易把人推向快速掃描、跳來跳去的狀態。

如果資訊太多,我常常會想要去清除那個「未讀數」(即使沒顯示),結果就是每次都大量、快速的瀏覽,卻很少真正消化,整個多巴胺的消費都變得很廉價。

而減少資訊量之後,我就可以慢慢讀、停下來思考、或者記住內容。當輸入的內容變少了,獲得的滿足感反而變得更多、更深層。

訂閱源分類法

我在之前的「這篇文章」有提到一種主題分類法:

  • 怦然心動的內容:只保留一定數量的訂閱源,確保自己有時間可以消化完,不會產生閱讀壓力
  • 資訊類、新聞類:通常只需掃描標題跟內容大綱,不必每篇都讀完

我依然覺得這是個不錯的方法,但問題是我太貪心了,每次第一類的訂閱數都會膨脹到無限大。

整理訂閱源就像是整理書櫃

我每年都有賣二手書的習慣,其實這是一樣的道理。

有些人喜歡多留書,想到的時候隨時可以拿出來翻;有些人則是偏向極簡主義,會用「容器」的概念來限制數量。例如:書架最多就只能放 30 本書,想增加一本書或一個訂閱源,就必須要移除一個舊的,這會逼自己不斷優化自己的「口袋名單」。

這其實是一個循環

訂閱循環:想知道新的東西→訂閱很多來源→資訊過載→開始篩選→只留怦然心動的訂閱源

講這麼多,我只是想說:「十幾個,就夠了」,我也是這麼覺得。

好啦,我要去整理我的書櫃了,這不代表書有什麼問題,只是我的書櫃擺不下了。

題外話:「Wiwi 百科」真的好用。

醫院一日遊記

今天早上去醫院的眼科與免疫科報到。

原本打算趁空檔看書,沒想到報到後第一件事就是點散瞳劑,帶來的書瞬間變成了吉祥物,只好被迫進入發呆模式了。

(話說,身為一個用眼過度、整天盯著螢幕的宅宅,我竟然沒近視也沒散光耶,真是太神奇了,傑克)

不吉利的數字

  • 「第一檢查室」
  • 「第二檢查室」
  • 「第三檢查室」
  • 「...」
  • 「第五檢查室......?」

啊,原來是避開了不吉利的數字!

不過我其實對「四」沒什麼意見耶,小時候老家就住在四樓,房價還因此比較便宜。對省錢一族來說,這根本就是幸運數字吧!(迷之吐槽:但也不好賣啊~)

不過現在的建商都學聰明了,直接跳過四樓就沒事啦,我以前的大學就是這樣:1F、2F、3F、5F。

神奇的外套

今天看到一位女士,外套上印著大大的四個英文字「MILF」,我看到的當下差點從椅子上摔下來,真是嚇死我了!(我以前也常常亂穿就是了 XD)

YouTube 自動配音

候診時,看到有人在刷 YouTube Shorts,明明看起來是個中文影片,也有中文字幕,但 YouTube 偏偏覺得這位臺灣人一定很想聽 AI 自動生成的英文配音,真不知道為什麼。(有原聲的話,應該沒有人會想聽 AI 的配音吧?不是只有我這樣吧!?

看醫生其實跟做運動很像

這兩件事有個共同點:每次執行前都很抗拒,能拖就拖,出門前百般不情願,但一切結束後,又會慶幸自己「還好有來」

還在拖什麼?馬上給我去掛號!(這段是給未來的自己喊話,因為我已經預測到以後的我會拖延了)

Windows 7 專業版

Windows 7 專業版(繳費機更新畫面)

Magic

magic-table magic-hat magic-rabbit magic-frog

(對不起......)