隨著大語言模型訓練對海量數據的需求不斷攀升,AI公司正變得越來越"數據饑渴"。為滿足這一需求,許多AI初創公司無視網際網路長期以來的通行規則——例如遵守robots.txt文件所標註的爬取禁區——轉而對各類網站進行大規模數據抓取。這迫使眾多網站不得不收緊數據訪問權限,或與AI公司簽署數據授權協議。健身與社交跑步平台Strava也朝著這一方向邁出了關鍵一步:通過限制網站訪問權限、向開發者收取數據接口費用來保護自身數據資產。
在防止數據爬取方面,Strava正在加強網站安全機制,要求用戶必須登錄後才能查看特定內容。此前,訪客無需登錄即可瀏覽公開個人主頁、健身俱樂部列表等資訊。
在API開放政策上,開發者過去可以通過免費的分級訪問計劃搭建基於Strava的應用——先申請基礎權限,隨著應用規模擴大再申請更高級別的訪問。如今,Strava對所有開發者統一收取每月11.99美元的固定費用,不過該公司表示具體價格可能因地區而有所不同。
Strava表示,其開發者社區規模已從去年的18.5萬人增長至今年的24.1萬人,公司將繼續為開發者提供支持。與此同時,Strava還計劃接入模型上下文協議(MCP
)——這一新興標準允許AI助手和應用以結構化方式訪問外部數據,從而使Strava能夠更精準地管控數據共享的內容與方式。
此外,Strava計劃關閉部分API端點(即允許第三方應用提取特定數據的獨立接口,例如俱樂部詳情資訊),以保護用戶隱私。Strava早在2024年就已收緊API使用規範,明令禁止將其用於AI訓練,並限制第三方應用展示其他用戶的數據。這些變更當時曾引發開發者強烈反彈,不少人表示其應用將受到嚴重影響。
儘管部分開發者可能接受訂閱付費模式,但部分API端點的關閉仍可能對依賴這些接口的應用造成衝擊。對此,Strava為開發者提供了90天的過渡緩衝期。
Strava首席執行官麥可·馬丁在接受TechCrunch採訪時表示,不受約束的AI數據爬取可能會成為扼殺公開網際網路的"最後一擊"。
"AI公司為了滿足對訓練數據的無盡渴求,正在不擇手段地抓取公開網站內容,這已經全面拖累了網站性能,"馬丁說,"過去幾個月裡,我們已多次遭遇性能下降,甚至服務中斷的情況。除了爬取公開網站,他們還試圖通過我們的API獲取數據,無視API使用條款。"
他透露,Strava已拒絕多家頭部AI實驗室提出的數據授權合作請求。其中,他點名批評了AI搜索初創公司Perplexity——儘管已被明確拒絕,該公司仍通過聚合服務中轉其爬蟲流量,以掩蓋真實來源。這與Perplexity此前在其他平台被指控的類似行為相吻合。
馬丁還特別提到,一批由AI輔助快速生成的"氛圍編碼"應用質量參差不齊,其API調用結構往往低效,對Strava伺服器造成了不成比例的負載壓力。類似的問題並不鮮見:去年Meta封禁WhatsApp第三方聊天機器人時,也援引了相似的系統負擔理由。
此次行動的時間節點或許並非巧合。Strava今年早些時候已秘密提交IPO申請,此番強化數據保護措施,或意在向潛在投資者傳遞"數據管理規範"的積極信號。面對外界將其與Reddit 2024年API收費風波相提並論,馬丁也主動回應了這一對比。他指出,Reddit按API調用次數定價,導致許多應用開發者根本負擔不起;而Strava採用固定月費的方式,目的正是維護整個開發者生態的健康運轉。
"我們希望用戶覺得自己真正擁有並掌控自己的數據,對我們的管理和保護方式感到放心。同時,我們也希望開發者能夠持續繁榮成長,"馬丁說。
Q&A
Q1:Strava為什麼要開始向開發者收費並限制API訪問?
A:Strava面臨AI公司和低質量應用的大規模數據爬取,導致平台性能嚴重下降,甚至出現服務中斷。為保護用戶數據和平台穩定性,Strava決定對所有開發者收取每月11.99美元的固定費用,並關閉部分API端點。同時,Strava也在籌備IPO,此舉也有向投資者展示數據管理規範的考量。
Q2:Strava的MCP支持計劃會帶來哪些變化?
A:Strava計劃接入模型上下文協議(MCP),這是一種允許AI助手和應用以結構化方式訪問外部數據的新興標準。接入MCP後,Strava可以更精準地控制哪些數據被共享、以何種方式共享,相較於過去被動應對爬取行為,平台將擁有更主動的數據管控能力。
Q3:Strava的API新政和Reddit的API收費有什麼區別?
A:Reddit在2024年按API調用次數收費,導致費用高昂,許多第三方應用開發者直接被擋在門外。Strava則選擇每月11.99美元的統一固定費用,希望在保護數據的同時,維持開發者生態的活躍度,避免重蹈Reddit引發大規模開發者反彈的覆轍。






