?? 插播一則消息:第十三期「真驛站」正在火熱招募中,歡迎掃描下圖二維碼報(bào)名!
AI·觀點(diǎn)
The Waluigi Effect|LLM 的「逆反心理」
Waluigi 是 Super Mario 游戲中的蘑菇頭,代表反動(dòng)勢力,那么,LLM(Large Language Model:大語言模型)為什么會(huì)成為「大反派」呢?這可能與 RLHF(Reinforcement Learning from Human Feedback:基于人類反饋對語言模型進(jìn)行強(qiáng)化學(xué)習(xí))相關(guān)???。如果文中提到的符號學(xué)模擬理論(Semiotic–Simulation Theory)是正確的,那么 RLHF 是解決 AI 對齊問題的不可逆不充分解決方案,同時(shí) RLHF 還可能會(huì)增加錯(cuò)位的風(fēng)險(xiǎn),即在通過越多的約束訓(xùn)練讓 LLM 滿足理想的屬性 P 之后,反而更容易讓其在與人的對話過程中展現(xiàn)出與 P 完全相反的屬性。https://www.lesswrong.com/posts/D7PumeYTDPfBTp3i7/the-waluigi-effect-mega-post
AI · 工具
好玩的|For Fun
?? Sumplete
在幾小時(shí)的 Prompt Engineering 之后,ChatGPT 獨(dú)立設(shè)計(jì)并寫出了這款益智游戲——來試試看,AI 自己寫的游戲如何吧!
?? Lemonaid
如果生活給你一顆檸檬,那就用檸檬汁來創(chuàng)造音樂吧——輸入想法,讓 5000 萬個(gè) MIDI 進(jìn)程幫你生成獨(dú)特音樂!https://www.genius.design/有用的|For Money
?? AI Prompt Playground by Nat Friedman
Nat Friedman 不僅經(jīng)營著 GitHub,還通過 AI Grant 與 Daniel Gross 一起投資 AI 早期公司。Nat 構(gòu)建了一個(gè)看起來平平無奇,甚至還有點(diǎn)眼熟的 AI prompt playground,但最重要的是,可以在這里對幾乎所有的 LLM 的 output 進(jìn)行對比——強(qiáng)烈建議取消那些無聊的會(huì)議,玩玩它!
https://nat.dev/
?? Buildt
YC 支持的創(chuàng)業(yè)公司,用 AI 幫助理解和使用龐大的代碼庫。想到可以在浩如煙海的代碼庫瞬間定位一條相關(guān)的代碼,有點(diǎn)浪漫是怎么回事?
與之相似的產(chǎn)品 Bloop - https://bloop.ai/
?? Meerkat
基于 LLM 的交互式數(shù)據(jù)框架,幫助技術(shù)團(tuán)隊(duì)以交互方式處理圖像、視頻、文本文檔等非結(jié)構(gòu)化數(shù)據(jù)。
http://meerkat.wiki/
?? Arcwise AI
一句話簡介:GPT Copilot for Sheets;更通俗易懂的名字:ChatExcel~
https://arcwise.app/
與之類似的產(chǎn)品 PromptLoop:
https://www.promptloop.com/
?? ChatPDF
與你的 PDF 文檔展開對話吧——提問、總結(jié)、翻譯,或者就是單純聊天——實(shí)測大部分時(shí)間都是靠譜的,偶爾自由發(fā)揮編纂些美好的「白日夢」。
https://www.chatpdf.com/
與之類似的產(chǎn)品 Humata(名字實(shí)在吃虧):
https://www.humata.ai/
?? Whimsical
一直在用的小工具有了更新,融合 LLM,點(diǎn)擊小星星,一鍵生成新思路。
https://whimsical.com/ai-mind-maps
?? OpenAI Translator
優(yōu)于 DeepL、谷歌翻譯的小插件,劃線翻譯,易用性與實(shí)用性拉滿!
https://github.com/yetone/openai-translator
與之類似的還有 - Bob,從 2020 年就一直存在的小插件,融合 ChatGPT API 后性能進(jìn)一步拉升:
https://bobtranslate.com/
成熟公司的新動(dòng)作 | From Big
微軟
Dynamics 365 Copilot - 主要針對銷售和營銷人員,類似于 Github 的 Copilot 讓開發(fā)人員更容易編碼,它旨在讓銷售人員更容易進(jìn)行銷售活動(dòng)。據(jù) Bloomberg 報(bào)道,納德拉認(rèn)為這是脫離單獨(dú)的 CRM(Customer Relationship Management:客戶關(guān)系管理)、ERP(Enterprise Resource Planning:企業(yè)資源計(jì)劃),朝著建立 Biz App Workflow 邁出的一步。
Power Platform AI Builder - 通過 Power Virtual Agents 中的 Chatbots 和 Power Automate 中的 GPT 模型實(shí)現(xiàn)了 Power Platform AI 升級。Power Platform 是一組無代碼解決方案,新功能在這些解決方案中嵌入了文本生成,使用戶能夠更智能地實(shí)現(xiàn)自動(dòng)化流程、預(yù)測結(jié)果并提高業(yè)務(wù)效率。
微軟的下一次更新是在 3 月 16 日,針對「工作空間生產(chǎn)力」,這可能意味著是 Office 365 的 AI 升級。
Salesforce
Salesforce 近期一連推出三個(gè)大動(dòng)作:
Eistein GPT - Salesforce 稱之為「The World's First Generative AI for CRM」,Eistein GPT 將被用于在 Salesforce 生態(tài)系統(tǒng)(銷售、營銷、客戶服務(wù)、開發(fā)等)中跨功能生成內(nèi)容,模型也將與 OpenAI 和其他模型集成,目前尚處于封閉測試階段;Gen AI Fund - 設(shè)立了 2.5 億美元的基金,旨在投資于生成式 AI 初創(chuàng)公司,該基金的愿景是發(fā)展「負(fù)責(zé)任的 AI (Responsible Generative AI)」,截至目前,他們已經(jīng)投資了 4 家公司:You、Anthropic、Cohere 和 Hearth;ChatGPT for Slack - Slack 的專屬 ChatGPT 應(yīng)用程序已上線(需候補(bǔ)),正如 Slack 的 CPO Noah Weiss 所說:OpenAI + Slack,真是非常好的組合。也許這是另一種共生關(guān)系 —— OpenAI 團(tuán)隊(duì)也在使用 Slack,并在其 Slack Workplace 發(fā)送了超過 500 萬條消息;現(xiàn)在,Slack 將使用 OpenAI 的 ChatGPT 來總結(jié)話題、針對特定項(xiàng)目的問題答案,以及生成給同事的回復(fù)。Jina AI - PromptPerfect
提示詞的設(shè)計(jì)一直是中文世界 LLM 用戶的痛點(diǎn),尤其是在圖像生成類產(chǎn)品,如 Midjourney 和 Stable Difffusion 的使用過程中,而 Jina 推出的 Prompt Perfect 無疑解決了這一痛點(diǎn)——用算法優(yōu)化提示詞,自動(dòng)化 Prompt Engineering,用魔法打敗魔法,讓用戶更容易地念出咒語,馴化 LLM 產(chǎn)品!
https://promptperfect.jina.ai
Quizlet - Q-Chat
Quizlet 的 Q-chat 不僅僅是提供信息來回答學(xué)生的問題,而是使用蘇格拉底式的方法來鼓勵(lì)批判性思維,并以此加深學(xué)生對學(xué)習(xí)主題的理解。用戶可以學(xué)習(xí)語言,選擇對所學(xué)材料進(jìn)行測驗(yàn),并像與真正的老師一樣與機(jī)器人互動(dòng)。
https://quizlet.com/blog/meet-q-chat
Snapchat - My AI
Snapchat 正在將聊天機(jī)器人帶給街頭的酷小孩,他們將推出一款名為 My AI 的應(yīng)用內(nèi)聊天機(jī)器人,它更像是一個(gè)聯(lián)系人,擁有自己的頭像,用戶可以隨時(shí)與其交談。考慮到 Snapchat 的用戶群十分年輕,這種 AI 功能的監(jiān)管很重要,就目前來看,Snapchat 的預(yù)設(shè)還不錯(cuò):My AI 確實(shí)有很強(qiáng)的行為及人格約束,例如拒絕回答家庭作業(yè)問題,在政治問題方面格外小心等等。
https://help.snapchat.com/hc/en-us/articles/13266788358932-What-is-My-AI-on-Snapchat-and-how-do-I-use-it-Zapier - Zapbots
Zapier 集成了 ChatGPT 并推出了 Zapbots(它還擁有記憶??),就目前來看,也許是構(gòu)建 AI App 最簡單的方式了——只需輸入您希望用戶提交/輸入的字段,添加邏輯(例如制作食譜),一個(gè)應(yīng)用程序即可上線供您與他人分享!https://zapbots.zapier.com/Luma Labs
基于 NeRF 將 2D 照片轉(zhuǎn)為 3D 視頻的軟件有了重要功能更新——實(shí)時(shí)的實(shí)景 3D 渲染!
https://lumalabs.ai/
效果視頻在此:
https://twitter.com/lumalabsai/status/1628832654840979457?s=12&t=HGCqSH9MlRxEMSHyuV8nKQ
Stable Diffusion - AI Render
官方 Blender 插件 - 如何真正讓視覺行業(yè)的從業(yè)者更好地用上視覺模型?來一個(gè)順手的工作流!
https://platform.stability.ai/docs/integrations/blender
AI·技術(shù)
AI 領(lǐng)域技術(shù)更迭日新月異。就學(xué)術(shù)論文來看,僅僅在過去的 2 月,Twitter 上點(diǎn)贊總數(shù)超 1000 次的學(xué)術(shù)論文就已經(jīng)超過了 30 篇,它們的研究重點(diǎn)也是各不相同,從自然語言處理到機(jī)器視覺,從基礎(chǔ)模型到模型微調(diào),從技術(shù)本身到與社會(huì)科學(xué)的交叉點(diǎn),百家爭鳴,百花齊放。這里選出了熱度最高的 5 篇,與大家進(jìn)行分享。Language Is Not All You Need: Aligning Perception with Language Models
語言不是全部:對齊感知與語言模型
作者:Shaohan Huang|Researcher @微軟亞洲研究院 等
微軟團(tuán)隊(duì)提出了一個(gè)名為 Kosmos-1 的多模態(tài)大語言模型(Multimodal Large Language Model, MLLM),可以理解語言、圖片等多種形態(tài)的信息,并且在不同任務(wù)中表現(xiàn)良好。此模型不需要人為調(diào)整參數(shù),可以在上下文中學(xué)習(xí)(few-shot)并遵循指令(zero-shot)。它可以感知通用模態(tài),例如,看一張圖片并描述它,回答與圖片相關(guān)的問題,或者根據(jù)文字指令來識別圖片中的物體;可以通過完成不同任務(wù)來進(jìn)行能力測試,比如語言理解、生成、OCR-free NLP 等;與此同時(shí),還可以從語言到多模態(tài)、從多模態(tài)到語言的跨模態(tài)轉(zhuǎn)移中受益。此外,作者還介紹了一個(gè) Raven IQ 測試數(shù)據(jù)集,用于判斷多模態(tài)大語言模型的非語言推理能力。In Summary
這個(gè)工作核心貢獻(xiàn)在于將上下文學(xué)習(xí)推廣到了普適的多模態(tài)場景,這意味著未來多模態(tài)領(lǐng)域也將擺脫任務(wù)層面的微調(diào),走向通過指令和示例來解決各種任務(wù)的新范式。
文章鏈接 - https://arxiv.org/abs/2302.14045
LLaMA: Open and Efficient Foundation Language Models Meta
AI「單 GPU」LLM 模型 LLaMA:開放高效的基礎(chǔ)模型
作者:Hugo Touvron|Research Scientist @FAIR Meta AI 等
Meta AI 團(tuán)隊(duì)加入基礎(chǔ)模型戰(zhàn)爭,推出了一組參數(shù)介于 7B 到 65B 的 LLaMA 模型,其中,LLaMA-13B 在大多數(shù)基準(zhǔn)測試中表現(xiàn)優(yōu)于 GPT-3(175B),而 LLaMA-65B 可以與表現(xiàn)最佳的模型 Chinchilla-70B 和 PaLM-540B 相競爭。雖然 Meta 在一開始就將模型定位為「開源的研究工具」,僅基于公開可用數(shù)據(jù)集進(jìn)行訓(xùn)練,以便其與開源項(xiàng)目兼容且可重現(xiàn),但其成品庫還是不知怎么的就在匿名論壇 4chan 被泄露了,目前種子文件已被合并至 GitHub 的 Facebook Research 頁面,并收獲 8.5k+ 小星星?
In Summary
超越 GPT-3 的開源替代,連預(yù)訓(xùn)練數(shù)據(jù)都是公開可得的——相當(dāng)于告訴大家你有計(jì)算資源就可以嘗試復(fù)現(xiàn)大模型。文章鏈接 - https://arxiv.org/abs/2302.13971
Theory of Mind May Have Spontaneously Emerged in Large Language Models
大語言模型可能自發(fā)地發(fā)展心智
作者:Michal Kosinski|組織行為學(xué)助理教授 @Stanford GSB
「心智理論(Theory of Mind, ToM)」,即人類推測別人的想法和感受的能力,對于人類社交互動(dòng)、溝通、同理心、自我意識和道德觀念都非常重要。Michal 讓幾個(gè)語言模型完成了一些經(jīng)典的「錯(cuò)誤信念任務(wù)(False Belief Task)」,這些任務(wù)通常用來測試人類的心智理論能力。結(jié)果發(fā)現(xiàn),2022 年 1 月發(fā)布的 GPT-3(davinci-002)能夠完成 70% 的任務(wù),相當(dāng)于 7 歲的孩子;而 2022 年 11 月發(fā)布的版本,davinci-003,則能夠完成 93% 的任務(wù),相當(dāng)于 9 歲的孩子。這意味著,隨著語言模型的語言技能不斷提高,可能會(huì)自然而然地產(chǎn)生類似于人類心智理論的能力。而 2 月 20 日,認(rèn)知神經(jīng)科學(xué)家 Simon Baron-Cohen 驚喜發(fā)現(xiàn),GPT-3.5 又通過了一些新的 Faux Pas Recognition 測試。In Summary
大語言模型的涌現(xiàn)能力是最令人著迷的,本文作者認(rèn)為語言模型也可以涌現(xiàn)出交流時(shí)會(huì)考慮別人的感受和想法的能力——這意味著語言模型距離圖靈測試更進(jìn)一步。
文章鏈接 - https://arxiv.org/abs/2302.02083
Multimodal Chain-of-Thought Reasoning in Language Models
語言模型中的多模式思維鏈
作者:Zhuosheng Zhang|Intern @AmazonScience,PhD Candidate @上海交大 等
本文提出了 Multimodal-CoT,在解耦合訓(xùn)練框架中融合視覺和語言特征來進(jìn)行復(fù)雜的推理,從而得出正確的答案,解決了引發(fā)多模態(tài) CoT 推理的關(guān)鍵挑戰(zhàn)。Multimodal-CoT 的關(guān)鍵在于,它可以將「基本原理生成」和「答案推理」分為兩個(gè)階段,生成有助于推斷最終答案的信息性基本原理,形成有效的推理鏈,從而幫助我們推斷答案,與之前的語言模型相比,Multimodal-CoT 的推理表現(xiàn)更好,甚至可以超過人類的表現(xiàn)。In Summary
過去的思維鏈的工作局限在純文本中,然而視覺信息對一些推理任務(wù)也是很重要的。這篇論文首次將視覺信息融入到了思維鏈中,在科學(xué)問答的數(shù)據(jù)集上用比 GPT-3 小兩個(gè)數(shù)量級的模型打敗了 GPT-3。文章鏈接 - https://arxiv.org/abs/2302.00923
代碼 & 模型地址:
https://github.com/amazon-science/mm-cot
Transformer models: an introduction and catalog Transformer
模型介紹與目錄