天天微頭條丨工程師利用GPT-4,實(shí)現(xiàn)對 AI 可穿戴設(shè)備進(jìn)行編程
(資料圖)
編程客棧(www.cppcns.com) 5月19日 消息:Project Ring 是一款腕戴式小型計算機(jī),它使用 AI 實(shí)時分析環(huán)境,并進(jìn)行文本描述,再通過 ChatGPT 對環(huán)境進(jìn)行評估。
這款可穿戴設(shè)備結(jié)合了語言和圖像模型,以提供人與 AI 之間更流暢的交互體驗(yàn)。
根據(jù)開發(fā)人員 Mina Fahmi 的說法,該項目旨在“展示低摩擦交互,將人類與人工智能之間編程客棧的物理和數(shù)字信息融合在一起。”
為此,F(xiàn)ahmi 構(gòu)建了一個帶攝像頭和操縱桿的腕戴式小型計算機(jī),可以使用Replicate image-to-text 模型對環(huán)境進(jìn)行實(shí)時可視化分析,用文本python進(jìn)行描述,并通過ChatGPT對其進(jìn)行評論。
整個過程中,使用 Eleven Labs 的文本轉(zhuǎn)語音服務(wù)將文本轉(zhuǎn)換為語音,然后通過 安卓智能手機(jī)傳輸?shù)焦莻鲗?dǎo)耳機(jī)。耳機(jī)有一個內(nèi)置麥克風(fēng),允許用戶對可穿戴設(shè)備說話,例如,詢問有關(guān)環(huán)境的問題。使用OpenAI 的 Whisper將用戶的語音轉(zhuǎn)換為文本,以便 ChatGPT 參與智能評論。所有數(shù)據(jù)都在谷歌云中處理。
Fahmi 稱他使用GPT-4完成了 Project Ring 的所有代碼生成。語言模型總共生成了大約750行代碼。其中包括用于 RASPberry Pi 的 python 腳本、云應(yīng)用程序、網(wǎng)站和 android 應(yīng)用程序。
需要注意的是,F(xiàn)ahmi 有編碼背景,但他已經(jīng)很多年沒有寫過任何代碼了。他相信項目表明使用 GPT-4來編寫完整的編程客棧軟件原型是可能的,雖然不是一件容易的事情。
該項目還強(qiáng)調(diào)了人工智能通過提供對環(huán)境的實(shí)時描述和評論來改善有視覺或聽覺障礙的人的無障礙環(huán)境的潛力。
項目展示了人工智能自動化編碼任務(wù)和創(chuàng)建完整軟件原型的潛力。它還強(qiáng)調(diào)了人工智能增強(qiáng)人機(jī)交互和提供體驗(yàn)世界的新方式的可能性。
標(biāo)簽:
相關(guān)熱詞搜索: