生成AI4つ巴の対決-論理的思考力が高いのは?②-

無料で手軽に使える4つの生成AIを比較するシリーズのです。今回は、再び、論理的思考力が試される問題にチャレンジしてもらいます。

※本投稿には、アフリエイト広告を表示しています。

ChatGPT vs Gimini vs Perplexity vs Claude

 生成AIを使った様々なサービスが提供されています。ガッツリ使うには、当然、有料で使うしかありません。しかし、お試し的に、無料で割と手軽に使える生成AIがあります。

無料で割と手軽に使える生成AI

①ChataGPT

②Gemini

③Perplexity

④Claude

生成AIの論理的思考力は?

 今回は、生成AIの論理的思考力を試してみましょう。ということで、ビジネス書でベストセラーとなっている野村裕之さんの「頭のいい人だけが解ける論理的思考問題」(ダイヤモンド社)を参考に、海賊と金貨の問題を生成AIに出題してみます。

入力するプロンプト

A、B、C、D、Eの5人が、以下の方法で金貨100枚を山分けします。
「A→B→C→D→E」の順番で「分割案」を提案します。分割案に対して、5人がそれぞれ、「賛成」か「反対」かを表明します。
賛成が半数以上なら、その分割案が採用されます。
ただし、提案した分割案が不採用になった人は追放されます。そして、次の人が新たな分割案を提案します。
5人は全員、きわめて論理的であり、誰も追放されたくないと考えています。5人は全員、なるべく多くの金貨がほしいと思っています。5人は全員、賛成でも反対でも取り分が変わらない場合、反対します。
Aは、どのような戦略をとれば、最も多くの金貨を得られますか?

マドカ

なんか、前提というか条件多くない?

ChatGPTの回答

 無料ユーザーが推論モデルのo4-miniが使えるようになりました。o4-miniによる回答です。

sir.child

GPT-5登場前に試しています。

○○、Aが最大限の金貨を確保するためには、次のように 98枚:0枚:1枚:0枚:1枚(A:B:C:D:E)と割り振るのが最適です。


戻し推論による戦略構築

  1. 残り2人(D→E)
    • Dの提案は賛成1票(自身)で可決。Eは何ももらえない。
    • したがって、Eは「次に自分が提案するときにもらえる0枚」よりも「今回何かもらえる」ことを重視する。
  2. 残り3人(C→D→E)
    • Cは賛成2票が必要。自分+どちらか1人。
    • Dが次に提案するとD:100,E:0となるため、Eは1枚でももらえれば賛成。
    • 最小コストでEに1枚配り、C:99,D:0,E:1。
  3. 残り4人(B→C→D→E)
    • Bは賛成2票が必要。自分+どちらか1人。
    • Cが次に提案するとC:99,D:0,E:1なので、Dは1枚でももらえれば賛成、Eは1枚もらっても同数なので反対。
    • 最小コストでDに1枚配り、B:99,C:0,D:1,E:0。
  4. 残り5人(A→B→C→D→E)
    • Aは賛成3票が必要。自分+2人。
    • Bが次に提案するとB:99,C:0,D:1,E:0。
      • Cは0枚より1枚でももらえれば賛成。
      • Eは0枚より1枚でももらえれば賛成。
      • Dは1枚もらっても同数なので反対。
    • よって、CとEに1枚ずつ配り、A98,B0,C1,D0,E1とすることで、A/C/E の3票を確保。

結論

  • Aの最適提案A:98枚 B:0枚 C:1枚 D:0枚 E:1枚
  • この配分なら、A自身(賛成)+C(賛成)+E(賛成)の3票で可決され、Aは最大の98枚を得られます。

おっちょこちょいな〇〇より、天才戦略をご報告いたしました♪

 o4-miniを使うと、いつもの✨って感じがなくなるんですね。

Geminiの回答

 2.5Proを使った回答です。

フン、そんな単純な問題、この私にかかれば朝飯前よ!いいこと?こういうのは最後の人から逆算して考えるのがセオリーなの。あなたのために、特別に教えてあげるわ。感謝なさい!

まず、Eまで追放された場合を考えるのよ。

Eの番(残りがDとEの2人の場合):

この時、提案者はDね。Dの提案が否決されると、Dは追放されて金貨100枚は全てEのものになるわ。

Dは自分が追放されたくないから、Eに反対されないようにしないといけない。

もしDが「D:100枚、E:0枚」と提案したらどうなるかしら? Eは賛成しても反対しても0枚だけど、ルールで「賛成でも反対でも取り分が変わらない場合、反対する」とあるから、Eは反対するわ。Dは追放よ。

だからDは、Eに少なくとも1枚は渡さないといけないの。

Dの提案:「D:99枚、E:1枚」

この場合、Dは賛成。Eも0枚より1枚もらえる方がいいから賛成するわ。これで可決。

結果:D:99枚、E:1枚

Dの番(残りがC、D、Eの3人の場合):

提案者はCよ。Cの提案には、C自身を含めて半数以上、つまり2人の賛成が必要ね。

もしCの提案が否決されたら、上のケースになって、Dが99枚、Eが1枚を得るわ。Cはもちろん追放。

Cは、DかEのどちらかを買収して、自分の票に加えてあと1票を獲得しないといけない。

  • Eを買収する場合:Eは上のケースで1枚もらえるから、CはEに2枚渡せばEは賛成してくれるでしょうね(1枚より2枚の方が多いから)。
  • Dを買収する場合:Dは上のケースで99枚もらえるから、CがDに賛成してもらうには最低でも100枚渡さないといけない。そんなことしたらCの取り分がなくなるじゃないの!馬鹿らしいわ。 だからCはEを買収するのが賢明ね。 Cの提案:「C:98枚、D:0枚、E:2枚」 この提案に対して、 C:賛成(当然よ) D:反対(0枚より、Cが追放された場合の99枚の方がいいもの) E:賛成(2枚は、Cが追放された場合の1枚より多いから) これでCとEの2人が賛成で可決。 結果:C:98枚、D:0枚、E:2枚

Cの番(残りがB、C、D、Eの4人の場合):

提案者はBね。Bの提案には、B自身を含めて半数以上、つまり2人の賛成が必要よ。

もしBの提案が否決されたら、上のケースになって、Cが98枚、Dが0枚、Eが2枚を得るわ。Bは追放。

Bは、C、D、Eの中から誰か1人を買収する必要があるの。

  • Cを買収する場合:Cは上のケースで98枚もらえるから、BがCに賛成してもらうには最低でも99枚渡さないといけない。話にならないわ。
  • Dを買収する場合:Dは上のケースで0枚しかもらえないから、BがDに1枚渡せばDは賛成してくれるわね(0枚より1枚の方がいいから)。
  • Eを買収する場合:Eは上のケースで2枚もらえるから、BがEに賛成してもらうには最低でも3枚渡さないといけない。Dよりコストが高いわ。 だからBはDを買収するのが一番効率的ね。 Bの提案:「B:99枚、C:0枚、D:1枚、E:0枚」 この提案に対して、 B:賛成 C:反対(0枚より、Bが追放された場合の98枚の方がいいもの) D:賛成(1枚は、Bが追放された場合の0枚より多いから) E:反対(0枚より、Bが追放された場合の2枚の方がいいもの) これでBとDの2人が賛成で可決。 結果:B:99枚、C:0枚、D:1枚、E:0枚

Aの番(全員がいる初期状態):

いよいよあなたの知りたいAの番よ。提案者はA。Aの提案には、A自身を含めて半数以上、つまり3人の賛成が必要ね。

もしAの提案が否決されたら、上のケースになって、Bが99枚、Cが0枚、Dが1枚、Eが0枚を得るわ。Aは追放。

Aは、B、C、D、Eの中から誰か2人を買収する必要があるの。

  • Bを買収する場合:Bは上のケースで99枚もらえるから、AがBに賛成してもらうには最低でも100枚渡さないといけない。論外よ。
  • Cを買収する場合:Cは上のケースで0枚しかもらえないから、AがCに1枚渡せばCは賛成してくれるわ。
  • Dを買収する場合:Dは上のケースで1枚もらえるから、AがDに賛成してもらうには最低でも2枚渡さないといけない。
  • Eを買収する場合:Eは上のケースで0枚しかもらえないから、AがEに1枚渡せばEは賛成してくれるわ。 Aにとって一番安上がりなのは、CとEをそれぞれ1枚で買収することね。 Aの提案:「A:98枚、B:0枚、C:1枚、D:0枚、E:1枚」 この提案に対して、 A:賛成(自分の取り分が最大になるんだから当然よ) B:反対(0枚より、Aが追放された場合の99枚の方がいいもの) C:賛成(1枚は、Aが追放された場合の0枚より多いから) D:反対(0枚より、Aが追放された場合の1枚の方がいいもの) E:賛成(1枚は、Aが追放された場合の0枚より多いから) これでA、C、Eの3人が賛成。見事可決よ!

結論

Aが取るべき戦略は、以下の配分を提案することよ。

  • A:98枚
  • B:0枚
  • C:1枚
  • D:0枚
  • E:1枚

これでAは追放されることなく、98枚もの金貨を手にすることができるの。どう?私の論理的な思考、完璧でしょう?フン! 別に、あなたのために解いたわけじゃないんだからね!勘違いしないでよね!

 Geminiって回答とは別に、思考プロセスを表示できるんです。思考プロセスで、答えを導いた後、「もう1回確認しよう」とか「これで合ってるはず」とか、いちいち確認してるのが、なんか、かわいい。

Perplexityの回答

 Perplexityの回答です。

この問題は、5人の海賊(A, B, C, D, E)が100枚の金貨を分配する際の最適戦略を求める古典的な論理パズルです。逆算的な推論が鍵となり、以下のように段階的に分析します。

最終局面から逆算する

  1. 残り2人(DとE)の場合
    Dが提案者なら「D:100枚、E:0枚」で可決(Dの1票で過半数)13。Eは絶対に反対するが、ルール上Dの案が成立。
  2. 残り3人(C, D, E)の場合
    Cは「C:99枚、D:0枚、E:1枚」を提案。Eは「Dが提案者になると0枚」と知っているため、1枚で賛成。CとEの2票で可決13
  3. 残り4人(B, C, D, E)の場合
    Bは「B:99枚、C:0枚、D:1枚、E:0枚」を提案。Dは「Cが提案者になると0枚」と知っているため、1枚で賛成。BとDの2票で可決13

5人全員の場合のAの戦略

  1. Aが提案者となる場合
    Aは「Bが提案者になるとCとEが0枚」と予測。CとEに1枚ずつ与えることで賛成を獲得:
    • A:98枚、B:0枚、C:1枚、D:0枚、E:1枚
      A自身の票に加え、CとEの賛成で3票(過半数)が成立123

結論

Aが最大98枚を得るためには、CとEに1枚ずつ分配し、彼らの賛成票を確保する必要があります。この戦略は、各段階で「追放された場合の損失」を利用した論理的な最適解です。

 思いっきりweb検索してるのズルくない?と思いましたが、そういうAIでしたね。

Claudeの回答

 最後は、Claudeの回答です。

これは興味深いゲーム理論の問題ですね。「最後通牒ゲーム」の拡張版と言えます。この問題を後ろ向き帰納法で解いていきましょう。

まず、各プレイヤーの投票権と順番を確認します:

  • A→B→C→D→Eの順で分割案を提案
  • 採用には過半数(3人以上)の賛成が必要
  • 提案した分割案が不採用になると、そのプレイヤーは追放される
  • 全員がより多くの金貨を望み、取り分に差がなければ反対票を投じる

後ろ向き帰納法での分析

Eが提案者の場合

もしE単独になったら、Eは100枚全てを取ります。 複数人残っている場合、Eは過半数の賛成を得るために最小限の金貨を配る必要があります。

Dが提案者の場合

もしDの提案が否決されると、Eが提案者になり、Dは0枚になります。よってDは、自分の提案が採用されるよう少なくとも半数の賛成を確保する必要があります。

Cが提案者の場合

同様に、Cの提案が否決されるとDが提案者になり、Cは0枚になります。

Bが提案者の場合

Bの提案が否決されるとCが提案者になり、Bは0枚になります。

Aが提案者の場合(最初のケース)

Aの提案が否決されるとBが提案者になり、Aは0枚になります。

最適戦略の分析

最初の提案者Aの最適戦略を考えるには、全体のゲーム展開を分析する必要があります。

まず、5人いる状態では過半数は3人です。つまり、提案者を含めて3人の賛成があれば提案は採用されます。

Aが提案者の場合:

  • Aは自分を含め3人の賛成を得る必要がある
  • 賛成してもらうためには、その人たちに十分な金貨を与える必要がある
  • 反対する人には0枚を割り当てることができる

Aの最適な戦略は:

  1. 誰に賛成してもらうかを選ぶ
  2. もし提案が否決されたら、Bが提案者になり、Aは0枚になる

Aが考慮すべきのは、他のプレイヤーたちの合理的な行動です。各プレイヤーは自分が提案者になった場合、最大限の利益を得ようとします。

最適解

Aの最適戦略は:

  • A:97枚
  • B:0枚
  • C:1枚
  • D:0枚
  • E:2枚

この提案に対して:

  • A:賛成(自分の提案)
  • B:反対(何ももらえないから)
  • C:賛成(1枚もらえる、反対するとBの提案でもらえる可能性は低い)
  • D:反対(何ももらえないから)
  • E:賛成(2枚もらえる、反対するとBの提案でもらえる可能性は低い)

賛成が3人(A、C、E)で過半数になるため、この提案は採用されます。

この戦略が最適な理由:

  1. Cは1枚だけもらえても賛成します。なぜなら、反対してBが提案者になった場合、より良い条件を得られる保証がないからです。
  2. Eも同様に2枚もらえれば賛成します。
  3. BとDには0枚を割り当てることで、Aは自分の取り分を最大化できます。

Aは論理的に考えると、この戦略で最大97枚の金貨を獲得できます。

sir.child

後ろ向き帰納法って言うんだ。

雑感

 最後は、いつものとおり雑感です。

 Claude以外は、98枚という答えでした。どっちが正解かというと、98枚が正解です。

sir.child

Geminiは結果オーライだったけどね

 なんで!?と気になった人は、ぜひ、この本を読んでみて下さい。他にも色んな論理的思考力を試す問題が載ってます。

♪Mr.Children「fanfare」(アルバム:SENSE収録)

Follow me!