宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Holy Sh*t,我的大便被賣給 AI 了

2026年05月17日 首頁 » 熱門科技
Reddit 上的 r/DHExchange 板塊從來都不缺奇怪的交易。但月初的一個帖子,還是讓見多識廣的我打了個問號。

「我囤積了一個非常有價值的大型資料庫,只是不是你想的那種……15 萬張糞便圖像。」

I hoarded a large database of something valuable, just not what’s you expect… 150k stools images
by u/Ill_Car_7351 in DHExchange
 

發帖人在正文解釋,他幾年前開發了一款叫 PoopCheck 的腸胃健康 App,通過它積累了超過 25000 名用戶上傳的糞便照片,經過標註和分類,形成了規模達 15 萬張的圖像資料庫。

他現在想賣掉訪問權限,稱這批數據「極為稀缺」,「對機器學習訓練和癌症研究都很有價值」,只是還沒想好定價,感覺自己「坐在一堆 shi...ny coins 上,卻找不到買家」。

坐擁金礦的人,把礦場開在你的馬桶旁邊

PoopCheck 創始人在 Reddit 上並不完全是在吹牛,他確實坐在一座金礦上,儘管這座礦的味道有些沖。

這款 App 的開發公司叫 Soft All Things LLC。404 Media 的記者聯繫了發帖人後,收到了創始人之一「Marco」的郵件回復,表示可以提供樣本數據,並詢問所需規模和用途。

記者說他需要 10000 條數據用於 AI 訓練,Marco 沒有拒絕。數據集分兩個檔位,一種是 AI 自動標註的,另一種是人工精標的,精標版更貴。

每張圖片都關聯著一系列用戶報告的數據點,以及對每張圖片的人工智慧分析結果。

用戶報告包括對一系列問題的回答,例如「你上次進食是什麼時候」「排便時是否有不適?(排便困難;灼熱感;銳痛等)」「花了多長時間?」 「氣味是否比平時更重?」「過去12小時內是否飲用咖啡或酒精?」

數據還包含人口統計資訊,包括年齡段、性別、身高、體重,以及「乳糖不耐受」或「腸易激綜合徵」等敏感狀況。每張圖像都通過一個名為「externalIndividualID」的欄位與特定用戶相關聯。

Holy Sh*t,我的大便被賣給 AI 了

AI 分析的數據點包括排便時間、每份糞便的布里斯托爾分級、是否「健康」或「不健康」、糞便的「形狀」和「質地」、是否含有血液或粘液、排便量(多、正常或少),以及是否「漂浮」。每個數據點還配有一個「置信度」評分,反映 AI 對其分析結果的信心程度。

PoopCheck 在應用商店的介紹頁面寫著「隱私第一」「絕不收集數據」。它承諾用先進的 AI 技術分析你的糞便,給出每日腸道健康評分。應用界面簡潔友好,有清晰的圖表展示你的排便規律,還有一個名為 SOFTie 的 AI 助手隨時解答你的腸道問題。

最吸引人的是,用戶可以選擇分享自己的糞便照片,獲得其他用戶的評論和建議,還能登上排行榜。截至 2026 年 5 月 14 日,社區里已經有 151317 張「共享糞便」。帖子標題五花八門,「像橡皮泥一樣」「有點擔心」「過去三周斷斷續續這樣」。

Holy Sh*t,我的大便被賣給 AI 了
Holy Sh*t,我的大便被賣給 AI 了

或許沒有人會想到,這些在私密的時刻拍下的照片,會被打包成資料庫在網上叫賣。

這也讓我想到去年衛浴品牌科勒 (Kohler) 做的一款叫 Dekoda 的新設備。它將一枚攝影機夾在馬桶側邊,藉助 AI 視覺分析排泄物,為用戶養成健康習慣提供數據支持。

Holy Sh*t,我的大便被賣給 AI 了

科勒,你老實說,是不是拿💩圖去訓練大模型了?

不是第一坨,也不會是最後一坨

如果你以為 PoopCheck 是一個孤立的奇葩事件,那說明你低估了這個行業的創造力。

Flo 是一款被數億女性用來記錄經期、排卵、懷孕的 App,曾在隱私政策里承諾不會把用戶的健康數據分享給第三方。然而 Flo 通過內嵌的軟體開發工具包(SDK),把用戶的記錄傳輸給 Facebook、Google 的分析部門及多家廣告平台。

Flo 在《華爾街日報》報道刊出後的當天,立刻停止了向 Facebook 共享數據。美國 FTC 於 2021 年與 Flo 達成和解,要求其通知受影響用戶並接受獨立隱私審計。圍繞同一事件的集體訴訟此後持續發酵,到 2025 年,Flo、Google、Flurry 三方合計面臨 5950 萬美元的和解金額。

Holy Sh*t,我的大便被賣給 AI 了

在線心理諮詢平台 BetterHelp 收集的是抑鬱狀態、自殺念頭、當前服用的藥物等資訊,平台在多個頁面反覆承諾保護用戶隱私。

但在 2023 年,BetterHelp 被指控將超過 200 萬用戶的敏感健康數據共享給 Facebook、Snapchat、Criteo 和 Pinterest,用於精準廣告投放。

該平台還在網站上展示了一個 HIPAA 合規徽章,暗示自己符合美國醫療數據保護規範,實際上沒有任何機構認證過它的合規性。FTC 最終要求 BetterHelp 賠償 780 萬美元。

有用戶在 FTC 案件留言區寫道:「我在心理危機期間註冊了這個網站……現在我聽說他們賣了我的資訊。」

而 23andMe 讓數百萬用戶把唾液樣本郵寄給它,承諾數據只用於健康研究,用戶對自己的數據擁有控制權。可公司於 2025 年申請破產後,基因資料庫突然成了清算資產,客戶的遺傳資訊隨時可能流向最高出價者。

FTC 向法院發出警告,要求任何收購方須遵守原有隱私政策。但在破產法框架下,隱私承諾究竟能被保護多少,答案並不樂觀。

數據是新石油,但油井在你腸子裡

AI 時代對數據的需求是結構性的、無止境的。大模型需要數據,帶標註的、來自真實人類的、覆蓋邊緣場景的高質量數據尤其稀缺,而且稀缺程度隨著模型能力天花板的提升在不斷加劇。

我想問 PoopCheck 開發者的是:你確實擁有一批稀缺數據,可這批數據是否經過了真實的知情同意?

知情同意(informed consent)這個概念來自醫學倫理,核心在於「知情」必須先於「同意」。用一份沒有人讀的協議來替代真正的告知,是在制度層面製造一種合法的欺騙。

還有一個容易被忽視的技術問題。即便數據經過了去識別化處理,通過「再識別攻擊」(re-identification attack),仍然可以把看似匿名的記錄與其他公開資料庫交叉比對,從而還原具體個人身份。

有研究顯示,只需 15 個數據點,就可以識別出幾乎任何一個美國人。PoopCheck 的每條數據記錄附帶的欄位遠不止 15 個,而且根本沒有做去識別化處理。

Holy Sh*t,我的大便被賣給 AI 了

一旦這批數據被買走並用於訓練模型,它就幾乎無法被真正刪除。大型語言模型和其他生成式 AI 系統可能記憶並再現訓練數據中的內容,這一特性意味著,要從已訓練的模型中外科手術式地移除某個具體個人的數據,在技術上往往是不可能的,除非從頭重新訓練整個模型。

美國沒有任何綜合性的聯邦科技公司數據隱私法律,HIPAA 只覆蓋醫療機構,消費級健康 App 幾乎完全游離在外。FTC 在 2024 年的一份聲明中說:「沒有哪條法律給 AI 公司設立豁免權。欺騙性數據收集就是違法,不管它是不是打著 AI 的旗號。」

一款免費 App 需要活下去,數據變現是最直接的路徑,AI 訓練數據的需求在這幾年急速膨脹,高質量的真實健康數據尤其罕見,於是一個開發者發現自己手裡攢了 15 萬張帶標註的人類生理數據,打開 Reddit,問:這東西值多少錢?

Flo 的經期數據賣給了廣告商,BetterHelp 的抑鬱記錄流向了 Facebook,23andMe 的 DNA 要被拍賣,現在 PoopCheck 的便便圖庫掛在數據交易論壇上。

Holy Sh*t,我的大便被賣給 AI 了

用戶的身體資訊,在足夠大的數據量面前,是可以被貨幣化的資產,而用戶之所以願意上傳這些資訊,往往是因為相信對方不會這麼做。

那麼,普通用戶能做什麼?答案老生常談,但還是值得說一遍。

下載任何免費 App 之前,先搜一下這家公司的商業模式,如果沒有清晰的付費路徑,想想它靠什麼活著。翻一翻服務協議里關於「數據使用」和「第三方許可」的條款,搜關鍵詞「sell」「license」「third party」看看。

參考:https://www.404media.co/ai-poop-analysis-app-offered-to-sell-me-access-to-its-users-poops/

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新