【実験】Google AI「Bard」は画像の中身を解析できる?
- 投稿日/更新日
結果
2023年5月13日現在、できないみたいです
はじめに
Google謹製のAIチャットボット「Bard」が2023年5月10日に日本語対応されて話題になっています。いろんなBardの記事をぼんやりと読んでいると、「Bardが画像の中身を見て判断しているっぽい」という書き込みがあったので、検証してみることにしました。
検証
テキスト
画像の中にあるテキストが読めるのかどうかを検証してみました。
今回の検証用に新たに作成した画像です。Googleの性質上、クロールしてキャッシュしている可能性を加味することにしました。これはどこのページにも使われていないので、クロールも当然されていません。つまりHTMLのALTや、ページ内のテキスト情報を基に判断できないはずです。ファイル名も「aitest-moji01.jpg」という中身が推測できないものにしています。
まったく返答になっていません。この時点でピンと来たのですが、どうもファイル名のaiに反応している感じがありました。次にファイル名を「osaka-city-fukushima-ku-noda.jpg」という名前にしてみるとどうなるでしょうか。
「大阪市福島区野田2丁目1番1号」と返ってきました。つまり画像の中を見ているのではなく、ファイル名しか見ていないことになりますね。しかも2丁目1番1号と勝手につけてます
画像の中身
以前から公開しているこの画像の中身を読むことはできるのでしょうか
食べ物であるとヒントまで与えたのに、「だし巻き卵」と返答してきました。いやたしかに卵は乗ってるけど。
「だし巻き卵ではない」と付けて再度質問したところ、「画像がぼやけていてわかりません」と返答が来ました。横1200px縦800pxもあるんですが…。
色
それではこのグラフの「色」を聞いてみるとどうでしょうか。この画像も以前から公開しているものです。
画像の中を読んでいるとは思えない返答がきました。
ということで、画像の中の解析はまだまだのようです。逆に、ファイル名をきちんと推測できるものにしておくことが大切なのかなとも思ったりしました。
備忘録として残しておきます。