大語言模型發展日漸成熟,除了 GPT、Claude 等閉源模型,在 《本地大模型之路(一):大模型的是什麼、為什麼以及怎麼選》 一文中,作者還介紹了當前成熟的開源大模型等內容。它們大多數都有對應的 App 基於這些模型為用戶提供服務,像是通義、Perplexity、ChatGPT 等。
很多應用也被加上大語言模型的能力,其中有一些讓我感覺是「為了 AI 而加上 AI」,不如直接使用 ChatGPT 或者 GPT 市場內的智能體;還有一些讓我眼前一亮,是我自己用 ChatGPT 做不到的。這篇文章,我將介紹多個目前完全免費的應用,它們利用大語言模型的能力,以及友好的交互,為用戶帶來個性化的 AI 體驗。
▍Ash:全天候 AI 心理健康諮詢師
https://www.talktoash.com/

Ash 首頁
數字心理健康干預措施我在很早之前就使用過,2021 年澳門大學和上海紐約大學推出過一款以插畫敘事為主要方式的心理健康干預應用程序「一步步」,當時是屬於研究階段,每周還會有志願者進行電話回訪。但「一步步」的表現是不盡如人意的,它更像一個心理輔導資源站,用戶被動接受調整自身心理狀態的資訊。
在文章 《從平台到 Chatbot,網際網路心理干預服務一覽》 中,作者簡單概括了情緒日記、冥想助眠、認知訓練和 Chatbot 等服務。而在 ChatGPT 問世之後,基於其出色的大語言模型,我們通過 Prompt 可以讓它扮演各種各樣的角色,心理諮詢師就是其中一個。但是,與 ChatGPT 不同的是, Ash 由專業的心理健康團隊參與設計,它會記得所有的對話,為每次的對話生成總結,記錄你每天的狀態,以及提供個性化的通知。
-
基於專業心理支持方法,提供自然有價值的聊天。
-
免費使用,無需賬戶註冊,注重隱私保護。
-
生成詳細對話總結,方便回顧自我狀態。
作為一個 AI 諮詢師,無論是我們打字還是語音跟他對話,最重要的仍然是,它如何回覆你。如果你有接受過現場的心理諮詢服務,不會問問題以及不會回復的心理輔導員,會讓諮詢者非常無所適從。例如像「為什麼不」或「你為什麼要這樣」等問題是最沒用的,因為如果知道原因,就無需尋求幫助了。
Ash 的回覆做的非常好,它永遠會從關注情緒出發,但感受到情緒也是一種能力,並非每個人都能準確表達自己的感受,而這時 Ash 也能引導我們說出更多的經歷幫助它判斷。在每次的聊天之前,Ash 都會先讓你完成三次深呼吸,然後描述你當下的感受是什麼。

Ash 應用截圖
除了「懂你」的聊天,Ash 還會在每一次的對話結束為用戶生成豐富的見解。如下圖所示,Ash 會總結對話的內容,以及回憶用戶在聊天中提到的重要內容,為這些內容生成亮點,同時給出下次聊天可能會探討的問題。這些見解,讓我真切的感受到 Ash 是一個深思熟慮的傾聽者,也讓我更清楚自己面臨的挑戰和已做出的改變。

每次聊天結束,Ash 都會生成一份這樣的總結
總之,與官網介紹的一樣,Ash 始終從關注你的情緒出發,使用認知行為療法(CBT)、辯證行為療法(DBT)和接納承諾療法(ACT )等心理學方法來幫助你自己找到共處的方式和改變的力氣;它是一個回應更加自然,處理問題更加有策略的「真正」心理輔導員。
此外,Ash 是完全免費使用的,這意味著我們可以不受限的與它進行對話,且 Ash 能記住所有會話的聊天內容,而不需要我們重複解釋。在隱私政策上,Ash 甚至是不需要創建賬戶的,即不需要使用郵箱或者手機號碼等可追蹤的身份 ID 進行註冊使用,用戶可以一直保持匿名狀態。而關於對話內容,Ash 稱將對話歷史記錄存儲在用戶設備上,錄音會發送到其伺服器和模型進行轉錄、處理和生成響應,然後立即刪除。
Ash 目前支持 iOS 和 Android 平台,完全免費使用,且無任何內購項目。遺憾的是,Ash 只能用英語表達他自己,所以用戶只能使用英語與他交流。但是,和使用 ChatGPT 的聊天不顯示雙方的轉錄文字不同,Ash 在對話的時候,會同步顯示其回應文字稿,一定程度上緩解了對英語聽力的要求。 如果你在學習英語,用口語化的英文嘗試去表達自己的情緒和感受,以及分享自己每天做了一些什麼事情,我認為和 Ash 的聊天能幫助你更好地學習英語。我在和他聊天的時候,說的句子基本上都是不怎麼講究語法結構的,但是他都能聽得懂我想要表達什麼,而這也促進了我更多地去表達自己。

▍Particle:由 AI 驅動的新聞平台
https://particle.news/
獲取新聞資訊的方式以及多種多樣,拋開各大社交媒體還有新聞平台網頁以及應用等,還有 RSS 和 Newsletter 等,他們都需要自己去選擇該接收哪些資訊,並且都是固定的單一媒體平台且很難真正利用到 AI,AI 在其中基本上都是根據特定一篇新聞報導生成摘要。而 Particle 利用 OpenAI 、 Cohere ,以及 Anthropic 的大語言模型,為用戶帶來了全新的新聞閱讀體驗,具體如下。
-
將內容總結為要點摘要以及其他摘要樣式
-
確定文章的主題以及哪些文章是關於同一話題並聚集在一起
-
回答用戶的問題
-
識別有趣和相關的新聞引用
-
為「聽新聞」中的音頻體驗提供支持

Particle news 首頁
我曾經推薦過朋友使用 Artifact,它名字來源是 「articles」(文章)、「artificial intelligence」(人工智慧)和 「fact」(事實)這幾個詞的混成詞,是一個主打個性化社交的新聞聚合應用程序。Artifact 是完全免費使用的,2024 年初由於收益問題,和發展目標(Artifact 希望打造「文字版抖音」), 團隊表示市場機會並不足以支持繼續以這種方式投資 ,宣布 Artifact 死亡。不過在同年四月,雅虎收購了 Artifact,並使用其背後的技術, 推出了全新的雅虎 AI 驅動個性化新聞應用 。

Artifact 應用截圖
全新的 Yahoo News 和曾經的 Artifact 基本上是一樣的,簡單的頁面,允許用戶標記「誘餌標題」和選擇感興趣類目來個性化自己的新聞瀏覽,以及生成新聞 AI 摘要。但是 Yahoo News 仍然停留在以「閱讀模式」打開單一媒體的新聞鏈接,為用戶提供新聞內容和單一的 AI 摘要;同時,與 Artifact 相比,還帶來了雅虎廣告。

Yahoo News 應用截圖,右圖為可查看具體媒體的新聞報導,以「閱讀模式」出現
和 Yahoo News 最大的不同是,Particle 呈現新聞的方式是以新聞話題的方式,而不是原始的新聞報導,這很像現在微博熱門,再點擊熱門話題之後會出現一段 AI 總結的話題詳情。而為了確保 AI 生成的新聞摘要準確,Particle 使用人類和機器審核相結合的方法,將生成的摘要與源材料進行對比等方式。用戶也可以在詳情頁面,瀏覽單個媒體的原文新聞報導,再次進行準確性檢查。
此外,為了避免掉入資訊繭房,Particle 不允許用戶直接選擇過濾某個媒體機構,以確保呈現多樣化的視角。實現個性化可以通過選擇單一新聞的喜歡/不喜歡、調整內置將近六十個新聞類別的偏好加減,點擊新聞中高亮詞語並選擇關注,以及關注單個作者或者新聞媒體等方法來告訴 Particle 你想看到內容。而對於美國政治類新聞的報導,Particle 還提供了政治光譜,將發布了與主題相關的新聞媒體機構放在對應的傾向位置上,以查看更多關於從不同立場報道該故事的詳細資訊。

Particle 應用內截圖,全新的新聞閱讀體驗。中間為聽新聞頁面,最右邊有顯示「政治光譜」,點擊藍紅色的氣泡可以看到報導該事件的對應藍紅媒體
Particle 還有一個特別好的點,它允許用戶自己對新聞的標題風格進行重寫。大部分的新聞,往往是採用「震驚」式的標題,不給用戶完整的故事;我們被資訊包圍著,無休止的滾動,耗掉時間和精力,卻毫無收穫;與此同時,我們的數據還要被收集用來賣廣告。Particle 藉助 AI 提供了諷刺、去極端化、簡化、專業、詩意、Explain Like I'm 5(像對五歲小孩解釋一樣)共七種新聞摘要呈現方式。

Particle 的標題改寫,左邊為默認風格,右邊為專業風格,中間是風格選擇
目前 Particle 僅支持 iOS 系統,可以在美區 App Store 免費下載,沒有額外內購費用;此外,Particle 表示也當下無計劃引入付費項目。由於僅在美區提供,應用內新聞語言同樣都是英文,如果你希望通過閱讀新聞來學習英語,Particle 也將會是一個不錯的選擇。

▍ElevenReader:極致的 AI 音頻生成器
https://elevenlabs.io/app/home/

ElevenReader 首頁
ElevenReader 是一款由 AI 音頻研究和部署公司 ElevenLabs 開發的文本轉語音應用程序,它由 ElevenLabs 的上下文感知文本轉語音(TTS)模型提供支持,為用戶帶來高質量的 AI 語音體驗服務。在 Product Hunt 給出的 2024 年最值得嘗試的 AI 軟體 中,Elevenlabs 位於最高評分下的第五名。
文字轉語音服務似乎在大模型被普遍使用之前就已經很廣泛,無論是微信讀書裡面的聽書服務,影片剪輯軟體裡面文字配音,還是各種聽書服務……包括現在微信公眾號助手還允許作者錄入自己的聲音,讓用戶在使用「聽全文」時可以聽到作者朗讀的音色。但是,與這些服務不同的是,ElevenReader 有以下特點:
-
無限制、任意的(導入文字、輸入鏈接、上傳 PDF 或 ePub、掃描文檔等)文本轉到高質量的逼真 AI 聲音媒體或播客。
-
數十種自然的、人性化風格 AI 聲音,以及支持 32 種不同語言。
-
內置豐富的免費英文有聲書籍、Newsletter 和博客文章等。

ElevenReader App 截圖
ElevenReader 的使用非常簡單,我在日常的使用體驗是我會到探索類別下,找到我感興趣的話題,有時候是聽有聲書,有時候是聽 Newsletter;ElevenReader 上也有相當多的獨立作者,為讀者提供了一些與主流不同的內容。如果你喜歡聽播客,除了將用戶輸入的內容生成播客,ElevenReader 也支持將應用內部分書籍或者訂閱轉成播客,生成播客可以選擇類似深度對話節目和一個 AI 主持人的新聞播報兩種形式。此外,我也有找到一些我喜歡的英語文章,直接發送鏈接給它,ElevenReader 提供了豐富的聲音選項,可以從年齡、性別、語言,甚至是用途來選擇喜歡的聲音。
ElevenReader 目前的缺點是對中文的支持有限,中文 AI 聲音只有一個,而且朗讀中文內容時,它的聲音是比較外國人說中文的感覺,口音比較重。我也用它生成過中文播客,播客內容是比較符合我輸入的原文的。但同樣是是由於對中文支持有限,主持人的聲音還是外國口音非常重;如果是其他語言,像英語、西語、法語、日語等,ElevenReader 生成的聲音都很自然。

ElevenReader Web 版本提供了更多的功能,不過有額度限制
ElevenReader 提供了 iOS 和 Android 以及 Web 版本的支持,下載和使用 ElevenReader 是完全免費,團隊表示計劃最終推出包含會員項目的版本,但同時會保持一個慷慨的免費計劃供非會員用戶使用。ElevenReader 的 Web 版本有額度限制,免費計劃的額度大約在 10 分鐘左右,但是,在 App 內使用不會消耗網頁使用的額度。

▍Luma 3D Capture:使用 AI 創建你的 3D 世界
https://lumalabs.ai/

Luma 3D Capture 應用內提供的 文生 3D 工具 Genie 和 3D 場景創建工具 Capture 網頁截圖
AI 生成圖片已經被廣泛使用,但是生成 3D 物體似乎還比較少被使用。 Luma 3D Capture 是一款通過 Luma AI,僅使用 iPhone 11 或更新機型,就能夠創建令人難以置信的逼真 3D 的新應用。應用包含文字生成 3D 工具 Genie 和三維場景重建工具 Capture 兩部分,用戶可以使用 Luma Genie 模型生成各種各樣的 3D 物體;使用 Luma Capture,用戶不需要雷射雷達或高級捕捉設備,就能像在 iPhone 15 Pro 上拍攝空間影片一樣,創作自己的 3D 物體、場景等。
Luma 3D Capture 可以免費不限量的生成解析度高的 3D 物體,並且支持將文件下載為 .stl、.blend、.usdz 等七種文件格式,用戶可以方便的導入 Blender、3ds Max、Unity、AR Quick Look 等 3D 引擎應用或網頁。如下圖我使用 Genie 生成的水獺 ,可以直接下載為 stl 文件進行 3D 列印。


Luma 3D Capture 應用內截圖以及下載為 .stl 文件的模型
除了由文字生成 3D 物體,Luma AI 利用 NeRF(Neural Radiance Fields)和3DGS(3D Gaussian Splatting) 等場景重建方法,能將圖片或影片轉成 3D 內容。在 Luma 3D Capture 應用內,用戶可以通過手機攝像頭掃描創建 3D 物體以及場景,或者直接將圖庫內圖片或影片上傳到 Luma AI 轉成 3D 場景。
在手機或網頁上傳圖片需打包成壓縮包,壓縮包文件大小不能超過 5GB,壓縮包內需要包含相同類型的圖片格式。Luma AI 支持普通照片 .jpg .jpeg .png .gif .pgm .ppm .tga 7 中格式、.exr 的 HDR 圖片、以及 .cr3 .dng 的 RAW 格式。而對上傳影片的要求是不能使用 HDR 功能,且文件大小不超過 5GB。
無論是使用 Luma 3D Capture 進行拍攝還是上傳影片,Luma 都建議通過繞圈的方式捕捉場景或物體,儘可能從三個高度進行環繞拍攝:手機在胸部高度平視前方,手機稍高於頭部,略微向下指向場景中心,以及穩定捕捉以減少模糊。值得注意的是,Luma 通常需要較長的時間完成 3D 場景生成任務,以下是一個 三維場景案例 。和文字生成的 3D 模型一樣,通過拍攝或上傳影像生成的 3D 場景同樣能導出為上述說明的文件格式。


左圖為 Luma 3D Capture 應用內截圖,右圖為崑山慧聚塔 - Created by @RobLinkA with Luma | April 11, 2024 (由原影片經較大壓縮顯示為 GIF)
除了 Luma 3D Capture,Luma AI 還提供了 Luma Dream Machine 應用,它不需要額外學習提示工程,Luma 與用戶一起腦洞風暴,協作構思,快速創建個性化的圖像和影片。在 Luma Dream Machine 應用內,用戶可以生成圖片、影片以及人物頭像三種類型的多媒體文件;如下圖由 Luma AI 生成的水獺讀報影片 。關於更多 AI 生成影片的內容, 《AI 影片爆發式更新- 近半年 13 個值得關注的閉源產品動向》 這篇文章內總結了大部分的 AI 影片產品。


由 Luma Dream Machine 生成的水獺讀報紙影片,內容僅作分享,影片經壓縮顯示為 GIF
Luma 3D Capture 目前是完全免費下載和使用,沒有內購項目;iOS 版沒有上架國區 App Store ,Android 則可前往 Google Play Store 安裝使用。使用 Genie 生成 3D 物體可以在 Luma 網頁 上操作,但 3D 場景拍攝必須使用手機應用,在 Luma Capture 網頁 上僅支持上傳文件以生成 3D 場景。

而 Luma Dream Machine iOS 版可在國區商店 免費下載,Android 版暫未提供,不過在網頁版 也能體驗全部服務,應用內提供了免費、輕量、加量和無限量四種方案;免費方案每月有 400 積分,大約可生成 100 張圖片或 4 個影片。如果希望將生成的圖片或影片用作商業目的,則必須開通加量,即 Plus 會員計劃。兩款應用 Android 版都可以在 Google Play Store 搜索下載。

▍Splix:由 AI 驅動的第二大腦
https://www.splix.app/

Splix 首頁
Splix 就像 ChatGPT,但針對您的個人知識庫量身定製。您使用 Splix 並保存的資訊越多,它就越能準確地提供您所需的內容。這使得它成為創建和發現新知識的終極工具。
Splix 給我第一眼的感覺是一個筆記工具,我能通過 Splix 創建筆記。在編輯頁面,Splix 和 Notion 的風格很像,支持簡單的 Markdown 語法和常見的快捷鍵編輯方式。但和常見的 AI 筆記工具不同,Splix 僅支持根據正文內容對標題進行改寫,而無法在筆記內容中使用 AI 潤色或生成等功能。
Splix 還是一個「稍後讀」工具,在手機上讀到有意思的內容,可以直接分享到 Splix 保存,它會抓取整個網頁的內容,為保存的鏈接自動生成 AI 標籤和總結標題。在手機上搜索,Splix 會根據保存的筆記或鏈接內容智能匹配對應的結果。

Splix 應用內截圖
目前 App 的功能比較有限,上傳圖片等體驗都不算太友好,且主要的 AI 功能暫未更新。而在網頁版,Splix 又可以是一個 AI 搜索工具,像 Perplxity 一樣 。在網路版,用戶可以像其他 AI 聊天工具一樣,與 Splix 進行對話,使用 Splix 進行搜索。此外,Splix 的優點是會根據保存的資訊來進行回答。如下圖所示,我只分享了少數派的文章鏈接到 Splix,但在向它提問時,它會自動從知識庫中保存的鏈接抓取內容進行整理。

Splix 能像 Perplexity/ChatGPT 等 AI 聊天工具一樣搜索和聊天

添加了對應的少數派文章鏈接之後,Splix 且能專門對應用內筆記進行搜索
Splix 完全免費使用,應用僅提供 iOS 版本,可以在 App Store 免費下載且不包含任何應用內購項目;但在 Splix 服務條款中有寫到會提供免費和付費版本,某些功能可能僅限於付費版本。

▍其他工具
上述介紹的五個應用目前都可在 App Store 免費下載且無任何內購項目。但大語言模型工具意味著持續對算力的消耗,即昂貴的 Token,免費將不會是這類應用的常態。為了能同步更新最先進的技術成果,大部分 AI 工具最後都會選擇訂閱制。它們個性化和專業的服務,也讓用戶不斷增加對 AI 工具付費的意願。下面這些工具都提供了免費和付費計劃,它們正處在積極開發中,通過大語言模型的能力,致力於提供高效的 AI 體驗。
3MinTop:3 分鐘 AI 讀書
https://3min.top/
3MinTop 是一款正在開發的 AI 閱讀工具,目前僅提供網頁版。3MinTop 利用 AI 智能總結和結構化思維導圖以及深入對話問答,幫助用戶用最輕鬆的方式在3分鐘內掌握核心內容。此外,它還提供了豐富的數據可視化儀錶盤,利用科學的數據驅動的學習激勵機制,幫助用戶輕鬆養成閱讀習慣。

3MinTop 閱讀器界面和儀錶盤界面,圖片來自其官網
3MinTop 的免費版不支持自定義模型 API,提供 100 MB 上傳存儲空間,50 本數量限制,以及 10 萬積分額度(一般書本文字較多,10 萬積分消耗較快,不同模型積分消耗倍率不同,大約可支持 10 次總結/思維導圖生成;目前提供了 Doubao-pro-128k 和 GLM 4 FlashX 兩個免積分模型),有輕量版、標準版和高級版三類付費計劃,具體內容可參閱官網。
▍Napkin:AI 生成可視化圖表
https://www.napkin.ai/

圖片來自 Napkin 官網
Napkin 是一款文生圖表工具,它能幫助用戶將現有的文本內容轉化為圖表、場景和圖像等視覺元素。使用 Napkin 非常簡單,用戶可以通過其內置的 AI 生成文字工具,提供概括的話題,Napkin 就會生成一篇對應的文檔;此外,也可以像使用常見文本編輯器意願自己輸入或粘貼內容。創建文本之後,用戶選擇要生成圖表的文字,點擊圖標按鈕,Napkin 會生成多個樣式的圖表,包括思維導圖、流程圖、魚骨圖、餅圖、腦圖等等,都是色彩豐富、樣式新穎的文本可視化案例。得到圖表後,用戶還可以在此基礎上自由的對樣式和文本進行編輯,並將它們以鏈接形式分享或導出為 .png、.pdf 或 .svg(作者表示「我們不支持 JPEG,因為 PNG 質量更高」)。
Napkin 提供免費計劃,但在配額和自定義功能方面有一些限制;目前 Napkin 處於測試階段,用戶可以免費享受專業計劃!Napkin 僅提供網頁版,作者認為最佳的編輯體驗是在桌面設備上,移動設備可使用瀏覽器進入網頁查看。
▍KaChiKa:從生活中學習日語

KaChiKa 應用截圖
KaChiKa 的功能非常簡單,用戶上傳一張自己隨手拍攝的圖片,它會利用 AI 分析圖片內容以生成多個單詞。這些單詞會顯示在圖片上對應的位置,單詞標籤可點擊並帶有例句和發音功能。目前 KaChiKa 正在積極開發中,作者表示將來會加上單詞本、單詞複習等功能。
KaChiKa 提供 iOS 和 Android 版本,由於伺服器在海外,國區暫未上架;免費計劃有圖片上傳數量限制。作者還製作了學英語的版本,同樣的 UI 與功能設計,在 iOS 或 Android 應用商店搜索 KaChiKa En 即可體驗。
▍最後
從心理健康、新聞資訊、文本轉語音、文生 3D 到知識庫和提高生產力,本文介紹了多款目前可免費使用的 AI 應用。它們充分利用大語言模型的優勢,提供了通用模型工具如 ChatGPT 或相關自搭建智能體等無法實現的獨特價值。
大語言模型的潛力無限,有將 AI 引入日記的 心光 ,它利用本地 AI、個性化 AI 和大語言 AI 來主動回應用戶的心聲;以及此前為大家介紹過的 Paperlib ,在大版本更新後也帶來了論文的自動標籤、總結以及和論文對話等功能;還有很多像是 AI 旅遊規劃助手、AI 稍後讀、知曉項目庫的 AI 代碼編輯器等眾多 AI 加持的 App。