讓你從 7 萬(wàn)張照片里面,找一張貓的照片。
崩潰不?
可就在最近,一位外國(guó)小哥就搞出了個(gè)神器 —— 只要 1 行代碼,就能輕松搞定這種海底撈針的事兒。
就比如剛說(shuō)的找“貓照片”:
裝上神器,終端進(jìn)入你存照片的文件夾,輸入“rclip cat”——
很快,10 張跟貓有關(guān)的照片就列出來(lái)了!
當(dāng)然,文字顯示不直觀,加個(gè)命令就能在圖片查看器中預(yù)覽:
再來(lái)一個(gè)抽象的:找跟“l(fā)ove”有關(guān)的。
幾秒鐘后四張人類或動(dòng)物相擁的照片(以及一張三朵“相擁”的向日葵)就出來(lái)了。
是不是挺好使?
看到這,你有可能會(huì)說(shuō)目前已有一些程序可以實(shí)現(xiàn)用文字檢索圖像。
不過(guò),小哥發(fā)現(xiàn)它們大多都只能用有限的預(yù)設(shè)詞來(lái)搜索 —— 而他這個(gè)工具和它們最大的區(qū)別就在這了。
下面就試試。
找一只正在打哈欠的狗,你就可以輸入“a yawning dog”。
搞定!
再來(lái)一個(gè),“woman jumping in the mountains”:
完美!結(jié)果都非常準(zhǔn)確。
emmm,如果你發(fā)現(xiàn)不準(zhǔn),很有可能是你描述有問(wèn)題。
比如你想找一些肖像,但如果直接輸入“portrait”,可能會(huì)出來(lái)一堆有人有狗有貓的“肖像”:
這肯定不是你想要的,這樣描述:a portrait of person,結(jié)果就對(duì)了:
心動(dòng)不?
就是 CLIP 的一個(gè)簡(jiǎn)單接口,你也可以試試
此工具被小哥命名為“rclip”。
看名字你也知道了,這就是用那個(gè)能實(shí)現(xiàn)圖像與文本的精準(zhǔn)匹配的 CLIP 做的。(rclip 代表 recursion CLIP,也就是遞歸 CLIP)
更確切地說(shuō),rclip 就是 CLIP 的一個(gè)簡(jiǎn)單接口。
當(dāng)你輸入查詢文本后,它所要做的就是加載模型,提取你所選目錄中所有圖像的特征向量,將它們存儲(chǔ)在數(shù)據(jù)庫(kù)(小哥用的 SQLite)。
其中,提取操作只進(jìn)行一次,也就是你第一次檢索的時(shí)候。
然后它再?gòu)哪爿斎氲牟樵兾谋局刑崛√卣飨蛄浚?jì)算它與你的圖像特征向量庫(kù)之間的相似性,最后輸出最相似的圖像。
下面是安裝與使用方法:
首先去 GitHub 上下載 rclip 最新的 AppImage 文件:
對(duì),目前該工具只支持 Linux x86_64……
如果你正在使用 Linux,下載好之后,執(zhí)行下面兩行就可以使用了:
$ chmod +x rclip-v1.0.0-x86_64.AppImage $ sudo mv rclip-v1.0.0-x86_64.AppImage /usr/local/bin/rclip
安好以后,就可以 cd 進(jìn)入你存圖片的目錄,開始“rclip + ‘關(guān)鍵字’”的檢索了。
首次使用提取所有圖片的特征向量需要花一些時(shí)間,這取決于你所存圖片的數(shù)量還有你的 CPU 性能。
ps.小哥的 72769 張照片是在性能較低的英特爾 Celeron J3455 處理器上跑了一天。
如果你只想要前 5 張照片并在本地默認(rèn)的圖片查看器上預(yù)覽,可以用下面的命令:
$ rclip -nf -t 5“kitty”| xargs -d ‘\n’ -n 1 xdg-open
最后,在線等一個(gè)能在 Windows/Mac 上實(shí)現(xiàn)這個(gè)功能的工具,大家有沒(méi)有!
GitHub:
https://github.com/yurijmikhalevich/rclip
demo 視頻:
https://www.youtube.com/watch?v=tAJHXOkHidw
參考鏈接:
https://mikhalevi.ch/rclip-an-ai-powered-command-line-photo-search-tool/
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。