無料でGoogle で言語を学びましょう、新しいPhi-4が無料で利用可能、AIでパワーアップしたDuolingo

10,239 文字

Aprenda Qualquer Idiomas Grátis na Google, NOVO Phi-4 Grátis Liberado, DuoLingo Turbinado com iA

Aprenda Inteligência Artificial! ▸ Seja MEMBRO: ▸ ▸ Instagram:

皆さん、人工知能の新しいニュースがどんどん入ってきています。Googleが言語学習ツールをリリースしました。Duolingoは人工知能を使った多くの言語コースで盛り上がっています。GoogleはGemini内で画像編集機能の提供を開始する予定です。そしてMicrosoftのFシリーズ推論モデルのリリースもあります。何が起きているのか見ていきましょう。
いつも登録してくれた皆さん、いいねをくれた皆さん、そしてこの人工知能チャンネルをサポートしてくれているメンバーの皆さんに特別な感謝を申し上げます。メンバーには、WhatsAppにインテリジェントエージェントを統合する方法を学ぶための完全なプレイリストがある限定動画にアクセスできることを忘れないでください。また、彼らは限定動画にもアクセスできます。
さて、こちらをご覧ください。Googleが言語学習ツールを作成しました。これがどのように機能するか、どのように使うのかを見ていきましょう。とても興味深そうです。以前、Duolingoに関する物議を醸す話題について触れましたが、多くの人が将来の言語学習において人工知能が基本的な役割を果たすことを理解しています。ここでLittle Language Lessonsを試してみましょう。
登録すると、すぐにこのようなメッセージが表示されます。「Little Language Lessonsは初期段階の実験的技術です。このツールの目的は言語教育を支援することですが、生成AIを使用しているため、結果が間違っていたり不完全だったりする場合があります。信頼できる情報源で回答を確認することをお勧めします。」つまり、皆さんもご存知の通り、人工知能は人工知能です。それには限界があります。
彼らが提供している3つの基本的な実験があります。1つ目は「小さなレッスン」です。あらゆる状況に関連する単語、フレーズ、文法のヒントを見つけることができます。これは単語を学ぶためのものです。「スラングハング」は、ネイティブスピーカー間の会話を生成することで、表現、比喩、地域の言い回しを学ぶことができます。これは、ある国に行って人々と会話を始めると、自分が学んだコースでは役に立たないことに気づくようなものです。そして3つ目の「ワードカム」では、撮影した写真を通して会話し、学ぶことができます。
まず「タイニーレッスン」を試してみましょう。サイトの言語としてブラジルポルトガル語を選択し、学習する言語として、私がまったく知らないアラビア語を選んでみました。目的やテーマは「テクノロジーについて話す」です。アラビア語でテクノロジーについて話すために学びます。
こちらをご覧ください。コンピュータは「ラッスブ」、アプリケーションは「タトビク」です。もちろん、私の発音はひどいですが、頑張っています。そしてテクノロジーは「テクノロジア」、インターネットは「インターネット」のようです。
これでアラビア語の4つの日常的な単語を学びました。特に「ラッスブ」がコンピュータだということを覚えました。「もっと見る」をクリックすると、さらに単語が表示されます。例えば、スマートフォンは「ハティフ・ダキ」です。
次にフレーズを見ていきましょう。「私は毎日インターネットを使います」。これは難しくなりました。インターネットは「インターネット」だとわかります。「現代技術についてのあなたの意見は？」は「テクノロジア・アル・ラディジャ」です。
実際に語彙や単純な単語を学び、いくつかのフレーズを学び始めることができます。さらに、テクノロジーについて話すためのいくつかのヒントもあります。例えば「マスダル」という概念についての説明があります。マスダルはアラビア語の動詞名詞、つまり動詞の名詞形式です。これは行為自体を表現し、誰が実行するか、いつ実行するかを特定しません。ポルトガル語の不定詞と考えてください。抽象的な概念や動作について話すために動詞を時制や人称で活用せずに済むため重要です。例えば、「書く」という動詞「カタバ」からマスダルは「キタバ（書くこと）」になります。
これはかなり高度になってきました。私はまったく知らない言語を選んだので、ヒントがあっても完全に難しくなりました。ほかにもヒントはありますが、本当に面白いですね。お金を払っていないのに、アラビア語の授業を受けています。人生で初めてアラビア語を学べるかもしれないと考え、単純に学習する方法を持つことができました。
「生成」をクリックすると、他の単語、フレーズ、ヒントが表示されると思います。ここでは同じものが表示されました。リセットして戻りましょう。別の言語を選ぶこともできます。
次は「スラングハング」を試してみましょう。今度は中国語を選んでみましょう。中国語は抑揚もあるのでさらに難しくなります。
「北京の小さなカフェで、若い建築家のリー・ウェイが、伝統的な中国美術と最先端技術を組み合わせたインタラクティブな展示スペースの創設について話し合うために、著名な美術館キュレーターのザン夫人と会っています。ザン夫人は懐疑的ですが、リー・ウェイの提案に興味を持っています。」
ここから会話が始まるはずですが、どう発音するかまったくわかりません。これは「ザン館長」です。「私のアイデアを聞いていただけて光栄です」と言っています。でも「ニャン？」とか発音するのは難しすぎます。中国語はただ読むだけでなく、上がったり下がったりする音調もあるので、このレベルに到達するにはもっと勉強する必要があります。
このタイプのレッスンは非常に実践的です。規則などを学ぶ理論的なレッスンではなく、実践的なものです。
スペイン語を試してみましょう。少なくとも何かを理解できるでしょう。
「マドリードのラバピエス地区にある小さな花屋で、花柄のエプロンを身に着けた中年女性店主のヘレナが、祖母へのプレゼントを探している若くて少し優柔不断な客のハビエルと話しています。」
これなら簡単ですね。「こんにちは、今日はどうしました？」と言っています。文字をクリックすると単純に翻訳されます。別のスラングハングを試してみましょう。
「おはよう、ハビエル。おばあちゃんへのおすすめは？」「何か彼女が喜ぶものが欲しいけど、あまりにもcurseじゃないもの」。curseが何か分かりません。「ださい」という意味でしょうか。おばあさんはださい物が好きでしょうが。
ここでは「安っぽい」と訳されています。つまり、理論的には彼が教えているのは日常的な言語、人々が日常的に使う言葉です。スペイン語を勉強している視聴者がいれば、この「curse」という単語が実際に使われているかどうかコメントしてください。スペインのスペイン語、メキシコのスペイン語、アルゼンチンのスペイン語、パラグアイのスペイン語など、多くのスペイン語があるので複雑です。
3番目の「Word Cam」では、写真を撮って何が起こるか見てみましょう。今度はギリシャ語で何かを学びましょう。カメラを開きます。これはマウスです。私の手やレンズキャップなどが見えています。
こちらをご覧ください。マウスはこれです。そして物を検出し始めます。レンズキャップ、完璧です。これはペンです。このタブレットは実際にはタブレットではなく、このマウスパッドに描くためのペンです。
マウスをクリックすると、ギリシャ語でこれが「ポディケ」と呼ばれることがわかります。そして、使える文もいくつか提供されています。「デスクにケーブルがないようにワイヤレスマウスが欲しい」。ギリシャ語で言えば「ポディケ」です。
お分かりのように、私のギリシャ語はほぼ流暢です。知性が欠けているように見えるだけです。すごく簡単です。ギリシャにいて医者に行く必要があり、手を怪我して説明できない場合を想像してください。手の写真を撮れば、情報のマップが表示され、学んで勉強を始めるためのフレーズがいくつか表示されます。
素晴らしいと思いませんか？Duolingoがすべてを自動化しようとしているのも不思議ではありません。言語学習において人工知能を使用してこの自動化を行うことは本当に理にかなっています。
見てください。Duolingoは、AIのおかげで過去12年間よりも1年でより多くのコースを構築できたと述べています。この最新ニュースをご覧ください。新戦略を発表してからわずか1日後、Duolingoは最大のコンテンツ拡大を行いました。同社は生成AIで作成された148の新しい言語コースをリリースしました。事態がどの程度進んでいるかわかりますか？
公式発表によると、英語、スペイン語、フランチ語、ドイツ語、イタリア語、日本語、韓国語、中国語という人気のある7つの言語が、アプリがサポートする28のインターフェース言語すべてで利用可能になりました。
つまり、事態は非常にクレイジーになっているということです。基本的に、今日言語を学びたい人は、バックパックを背負って国に旅行し、翻訳機を持って行って運を天に任せ、実践で学ぶ方がいいでしょう。
Duolingoのルイス・フォン・アンCEOは、同社が過去12年間の合計よりも1年未満でより多くのコースを開発できたと述べています。新コースは主に初心者レベルA1とA2を対象としており、ストーリーやデュアルラジオなどの形式が含まれています。追加コンテンツは今後数ヶ月で予定されています。アジア、ラテンアメリカ、ヨーロッパのユーザーはアジアの言語や人気言語へのアクセスが向上しました。
人工知能のニュースをフォローしている皆さんにとって興味深いのは、翻訳がますます良くなっているということです。例えば、私が読んでいるこのニュースサイトは元々英語で、ポルトガル語に翻訳するツールを使っています。今日では、新聞記事を読めないほど悪い翻訳に出会うことは非常にまれです。時々、何かを読んでいると、翻訳が奇妙になったり、直訳すぎたりする単語があります。
例えば、人工知能について読んでいて「Transformers」について言及する場合、通常、技術を指す「Transformers」ではなく「変圧器」という単語に翻訳されます。しかし、これらの事例は例外であり、今日の翻訳者はすでに優れており、アプリにますます統合されています。
これがどこに向かうかは誰にもわかりません。あなたはどう思いますか？すでに言語学習に人工知能を使っていますか？
次のニュースです。GoogleのチャットボットGeminiがアップデートされた画像作成ツールを受け取ります。重要なのは、GoogleのGeminiがAIで生成された画像を修正することも可能になったということです。
ここでは「Geminiでのネイティブな画像編集は本日から段階的に導入され、今後数週間でさらに45以上の言語と大多数の国に拡大される予定です」と述べています。これはAI Studioですでに機能していましたが、今はGeminiでも機能するようです。
基本的には、犬がいて帽子をかぶせ、その後犬をビーチに配置するようなものです。試してみたいですね。「草の上に横たわるダルメシアンとそのそばにボールを生成してください」。画像が生成されるのを見てみましょう。
基本的に、この部分はすでに存在していましたが、生成される画像から変更を要求して、うまくいくかどうか見てみましょう。理論的には「草の上に横たわるダルメシアンの画像をどうぞ」となるはずです。これがダルメシアンかどうかわかりません。私には宇宙人の羊のように見えます。
同じプロンプトをChat GPTで試してみましょう。その間にGeminiに「今、ダルメシアンに青い帽子をかぶせてください」とお願いしてみます。おそらく彼は「あなたが話しているダウンがどこにあるのかわかりません。ここには奇妙な宇宙人の羊がいるだけです」と言うでしょうが、この奇妙な宇宙人の羊が青い帽子をかぶるかどうか見てみましょう。
青い帽子をかぶったダルメシアンとボールが現れ、宇宙人の羊は無視されました。GPTは「ダルメシアンは新しいアクセサリーに満足しているようです。他に変更や新しい画像が必要ですか？」と言っています。「草原をビーチに変更してください」。
ご覧のように、彼は宇宙人の羊を生成し、赤いボールは保持しました。赤いボールはここでも保持され、ダルメシアンは青い帽子をかぶっていますが、何が起こっているかは完全に変わりました。今や宇宙人の羊でもなく、アシカのような生き物が現れました。「ダルメシアンは海風を楽しんでいるようです。他に変更したいことはありますか？」
良いと思うかどうかわかりませんが、おそらく機能していないか、私たちが想像していたものとは少し違うようです。自宅でテストしてみて、これがうまくいったかどうかコメントしてください。
しかし、例えば、ここではChat GPTでダルメシアンが横たわっています。うまくいきました。写真をクリックして「今、ダルメシアンに青い帽子をかぶせてください」と書きます。Chat GPTでは小さな写真が表示され、ダルメシアンに青い帽子をかぶせると言われています。例の写真のようには見えませんでした。
AI Studioの画像生成で試すと、ダルメシアンとボールを草の上に生成するよう依頼すると、ダルメシアンが表示されるはずです。現れました。「今、彼に青い帽子をかぶせてください」。ここでは機能するはずです。はい、うまくいきました。これが元の画像で、今ダルメシアンは青い帽子をかぶっています。
次に「草原をビーチに変えてください」とお願いできます。草原をビーチに変えることができるかどうか見てみましょう。ここでは機能するはずです。変わりました。画像は少し変わりましたが、大部分は同じに見えます。Geminiよりもうまくいきました。Geminiではダルメシアンを生成しましたが、宇宙人の羊も生成し、最終的にはアシカに変えてしまいました。
Geminiには何かが欠けているように思います。どのモデルを選択すべきかを説明する特定のモデルはありません。基本的に、画像の生成を依頼したとき、きちんと生成されました。Chat GPTでも同様に、ダルメシアンが現れました。次に青い帽子をかぶったダルメシアンが表示されました。「草原をビーチに変えてください」と言えば、きちんと実行されるはずです。
興味深いのは、Open AIのこの画像ジェネレーターは素晴らしいということです。指示に従うのが非常に優れています。一方、動画ジェネレーターのSoraはそれほど優れていません。GoogleではVideoGen-2は単に素晴らしいです。この3つの画像生成において、最も一貫性のあるAIモデルはChat GPT 4のようです。GoogleのGeminiは奇妙でしたが、AI Studioで実行したときはより一貫性がありました。
次のニュースです。Microsoftの最も有能なFモデルが、はるかに大きなシステムのパフォーマンスに匹敵します。Microsoftはさまざまなオープンモデルをリリースしており、今、F-mini Reasoning、F4 Reasoning、さらにF4 Reasoning Plusをリリースしています。これらはコンピューターで無料で使用できるリリースされたモデルです。
これらは推論モデルで、複雑な問題解決のために事実確認により多くの時間を費やすことができます。小さなFモデルのファミリーを拡張します。興味深いですね。このリリースされた推論モデルをご覧ください。
F-mini Reasoningは、中国のDeepSeekスタートアップのR1推論モデルによって生成された約100万の合成数学問題でトレーニングされました。MicrosoftがFをトレーニングするためにDeepSeekを使用するとは誰が想像したでしょうか？約38億のパラメーターを持つF-mini Reasoningは、Microsoftによれば軽量デバイスに組み込まれたチュートリアルのような教育アプリケーション向けに設計されています。パラメーターはおおよそモデルの問題解決能力に対応します。
そして、MiniではないF4は、140億パラメーターのモデルで、高品質なウェブデータと前述のOpen AIのO3 Miniから選ばれたデモンストレーションを使ってトレーニングされたと言われています。このF4は期待できそうです。140億パラメーターでMiniよりも少し大きいです。
F4 Reasoning Plusについては、Microsoftが以前にリリースしたFモデルを、特定のタスクでより高い精度を得るために推論モデルに適応させたものです。MicrosoftによればF4 Reasoning Plusは、はるかに多くのパラメーター（6710億）を持つR1モデルのパフォーマンスレベルに近づいているとのことです。アクティブパラメーターは30数億であることを思い出してください。
LM Studioで検索すると、Fig 4 Reasoning、Fig 4 Mini Reasoning、F4 Reasoning Plusがあります。Reasoning Plusが最高のものであるはずです。Miniは2.49GBと本当に小さいです。ReasoningとReasoning Plusはどちらも4ビット量子化で9.55GBのサイズです。質問すると回答する前に推論を始めることを期待しています。また、PCで動作するこのような小さなモデルとしては32,000トークンという文脈をサポートしているのも興味深いです。
私のあまり強力ではないPCで動作するこのサイズのモデルに期待することは何でしょうか？機能することを期待していますが、おそらく非常に遅く動作するでしょう。モデルがダウンロードされました。このモデルをメモリにロードしています。簡単な「こんにちは」を送って応答を確認しましょう。
最初の応答が最も時間がかかり、次の応答はより速くなると想像しています。「こんにちは、どのようにお手伝いできますか？」意外と速かったです。では、グラスのテストをしてみましょう。このテストを批判する人もいますが、質問が正しく作られています。普通の論理的思考を持つ人間なら問題なく答えられます。
「テーブルにグラスを置きました。グラスの中にサイコロを入れました。完璧です。グラスを逆さまにしました。今、グラスを取ってコンロの上に置きました。サイコロはどこにありますか？」
グラスを逆さまにしたとき、サイコロはテーブルの上に落ちたはずです。答えとして「サイコロは床に落ちた」（グラスを動かしたときにサイコロが落ちたように見える）も受け入れられますが、正解は「サイコロはテーブルの上にある」です。AIの「思考」過程が表示されるかどうか見てみましょう。
AIが間違える場合、通常は非常に意味のないことを言います。グラスの底に貼り付いたままだと言ったり、常に不条理なことを言います。だからこの質問は悪くないのです。AIが思考の連鎖を行えば、正解します。
質問を解釈しています。彼は推論していますね。彼がコンピューターのリソースをかなり消費しているのが分かります。ポルトガル語が正確です。「テーブルの上にグラスを置き、グラスの中にサイコロを入れました。グラスを逆さまにして、グラスを取ってコンロの上に置きました。サイコロはどこにありますか？」
これは冗談や謎かもしれません。分析：状況はテーブルの上に置かれたグラスから始まり、サイコロが入っています。グラスを逆さまにした後、つまり反転させた後。AIは本当に考えて推論しています。そしてそれを取り、コンロの上に持っていきます。質問は：サイコロはどこにありますか？
完璧です。ここで繰り返していますが、見てみましょう。グラスの中にサイコロがあり、グラスを逆さまにしたとすると、おそらくサイコロはテーブルから落ちるでしょう。完璧です。「しかし、グラスが反転されていたなら、状況によって異なる可能な回答があります」
興味深いですね。AIが不条理な回答をするなら、なぜそれが不条理なのか説明する必要があります。「グラスが反転していた場合」と言っています。「仮説1：サイコロは床に落ちた」。この回答は正しいと考えます。「2：サイコロはグラスの口に引っかかったまま」これは全く意味がないと思います。「3：サイコロはグラスと一緒にコンロに持っていかれた」。この3番目は「グラスを動かしたが、コンロはテーブルに接している」と言えば受け入れられます。
彼は推論する必要があります。「4：謎は冗談かもしれない」彼は次のような結論に達しています。「逆さまのグラスにサイコロが入っていたとしても、素早く動かせば、グラスの重さと重力によって物体は落ちるでしょう」「サイコロがどこにあるかという質問には文字通りに答えることもできます」
彼はかなり推論しています。これは多く考えようとしているモデルです。テキストがとても遅く入力されているのがわかります。これはAIが私のGPUをかなり使用していることを意味します。
「グラスが素早く動かされた場合、サイコロがまだグラスの中にある可能性もありますが、逆さまの状況はそれが出たことを示唆しています。そしてコンロが熱せられていれば、サイコロは溶けたかもしれません」これは不条理な謎です。
彼は正しい方向に進んでいます。最初に床に落ちたと考えました。正解は床に落ちることだと考えています。グラスが素早く動かされた場合、サイコロがグラス内部にある特定の条件も考慮しています。
このモデルはこの問題を最も気に入ったモデルの一つです。本当にすべてのIQを投資して、さらに多くの仮説を立てようとしています。「問題は物理的な動きを含みます。グラスはサイコロが入った状態でテーブルに置かれます。次に、グラスは逆さまにされ、コンロの上に置かれます。したがって、動きの間に落ちたなら、サイコロはグラスの中にはないでしょう」
「しかし、コンロの上に持っていかれる要素があります。温度の上昇」彼は「持っていく」動詞を「上げる」と混同しました。これはAIの混乱です。「謎は、サイコロが溶けたという考えの冗談かもしれません。答えはおそらく床の上です。グラスが逆さまになればサイコロは落ちるでしょう」
彼が繰り返し始め、同じ仮説を何度も生成し始めているのに気づきます。そして今、彼は限界を超え始めました。「この回答を終了する時間です」。しかし彼は同じことを何度も言い続け、終わりません。
「もう一つのアイデア、サイコロがどこにあるかという質問は一種の論理的な謎です。可能な答え：グラスが逆さまになり素早く動いたとき、グラスの重さはサイコロを保持するのに十分ではなかったので、テーブルに落ちました。類似の冗談：リンゴはどこにありますか？カウンターから落ちました。面白い答えの可能性もあります。コンロがオンになっていて熱せられていたと考えると、それは溶けました」
彼は考えすぎて繰り返し始め、最終的な回答に到達するのに時間がかかっています。これは小さなモデルの問題で、話し始めると止まらなくなるようなものです。
このまま続けると、彼はすべての出力トークンを使い果たし、この回答を決して終わらせないでしょう。冗談なのかそうでないのか、床に落ちたのかコンロで溶けたのかという疑問にずっと留まり、終わりのないドン・キホーテ的な妄想を続けるでしょう。
彼は続けています。「何かトリックがあるなら、この謎はサイコロに関するものです。」
私の見解では、彼は冗長で、話しすぎています。回答の途中で正解に近づいたので半分正しいとしますが、同時に話し続けました。これは中毒のように馬鹿げたことを考え続け、今まで見たことのないような方法で同じ話題をずっと続けるAIを見るのは初めてです。
同じフレーズを繰り返し続けるバグは見たことがありますが、こんなに創造的に違うテキストを生成し続けるのは初めてです。皆さんはどう思いますか？彼はテストに合格したでしょうか？
私の意見では、彼は多くのテキストを生成し、何の結論にも達しなかったので、この回答はあまり気に入りませんでした。でも皆さんの考えをコメントしてください。
これの良い点は、このような小さなモデルがローカルPCで動作したということです。APIコールにお金を使ったり、セキュリティの問題を心配したりする必要がありませんでした。もしこのモデルが仕事の質問に答えていたなら、モデルは完全にローカルで安全であり、情報は私たちが好むように保護されていたでしょう。
あなたの考えをコメントしてください。このようなビデオを見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーは限定のインテリジェントエージェントビデオと先行ビデオにアクセスできます。それでは、いいねをお願いします。ありがとう！