言葉間の連結が遠いやつを「自信がない回答」という認識はできて、当然近いやつは「自信がある回答だからユーザーさんに流されない」という判断もできるのだけれど、非常に中途半端な言葉の連なりのやつは、どちらにも属さずにハルシネーションに陥ってしまう
要はうろ覚え案件なので、学習データが増えればこういうのはだいぶ減っていくものと思われ、次のベースモデル候補のGPT-4.5とか5とかはずいぶんマシになってるんだと思う。
@ponapalt@ukadon.shillest.net そういえばこの間、Geminiに『「うろ覚えの専門家」と「ハルシネーションを起こす機械学習」のどっちに信を置くべきか』って質問したら前者って答えが返ってきたな
どっちもアテにならんっていう答えを期待してたけど
@unebi そのうち後者になるので正直どっちでもええわ案件ではある
@ponapalt@ukadon.shillest.net 60とか回った専門家とか、20代の頃に読んだ本とか覚えてるんかなあ?みたいなところもあるけど、インターネッツのゴミ蓄積由来の機械学習かあ…みたいな気持ちもある
でも良く考えたら本でも人類って言うゴミ由来だから怪しいのは一緒か…
@unebi どっちも一緒、等しく信用できない、それならばまだ多くデータを食ったやつのほうが確率的にマシ。