AIは国家競争力、ソブリンAI、韓国ファウンデーションモデル、AIスタートアップ等 | チョコーディングのポッドキャスト #12

LLM・言語モデル
この記事は約47分で読めます。

このインタビューは、韓国を代表するAI企業UpstageのCTO李活石氏が語る、AI技術の国家戦略的重要性とソブリンAIの必要性についての貴重な議論である。AI技術が国家競争力に直結する戦略技術として位置づけられる中、韓国独自のファウンデーションモデル開発の意義と課題、グローバルビッグテックとの競争戦略、そしてAI時代に求められる人材像まで、AI業界最前線の生の声を通じて現在のAI市場の動向と未来展望を包括的に探る内容となっている。

はじめに:AI技術の戦略的重要性

AI技術が国家の立場から必ず確保しなければならない戦略的技術として見ることができるんです。内製化して確保しなければならない側面があるように思います。

仕事がよくできる韓国語話者か、今日は外国人と仕事をしたいか。韓国語は非常に上手だけれど仕事ができない人と一緒に働こうとすれば、仕事がよくできる方が先でしょう。

新規モデルが出てくると、だんだん一般的に使用するには性能がある程度収束していく様子が見えます。

B2B事業を通じて確保されたデータがあります。パブリックデータがより多いか、プライベートデータがより多いかといえば、誰かはまたプライベートデータの方が多いだろうと言います。企業内でどの程度データを公開するかという問題もあります。

モデルを見ると韓国語も非常によくできますよね。データ比率上、韓国語が多くならなければならないかというと、そうでないかもしれません。

今日は国内AI代表主自と言える、UpstageのイファルソクCTOをお招きしました。お会いできて嬉しいです。

はい、お会いできて嬉しいです。

自己紹介とUpstage会社紹介

まず簡単な自己紹介と共に、Upstage会社についての簡単な紹介をお願いします。

はい、こんにちは。Upstageで共同創業者兼CTOを務めているイファルソクと申します。AIの分野に飛び込んでから約10年以上になると思います。以前はNaver CLOVAでビジュアルAI、つまり画像や動画を扱うAIを作る責任者、役員まで務めました。そこから出て創業することになりました。

Naverの時にかなり多くの成果を出して多く知られるようになったのですが、その時私が文書画像を扱うOCR技術を多く手がけたことで、国内ではかなり知られるようになりました。

Naver CLOVAのビジュアルAI責任リーダーというのは非常に重要なポジションですが、それを突然置いて新たに創業された動機が気になります。

Naver領収書リビューがありましたよね。はい、そうです。それは私がいた時に領収書を自動で認識する、領収書を撮ると店名が何で、メニューが何で、個数と金額などが自動で認識されるシステムです。そこに入るAI技術を作りながら正式に領収書リビューサービスがローンチされ、このような経験をNaverでたくさんしました。

それをずっとやってみて、本当に達成感も良く、気分も良かったのですが、一方でこんな考えが浮かびました。これがNaverでのその支援があったからこそ可能だったということを私はよく知っているんです。インフラでも、開発者人材プールでも、すでによくできているサービスでも、このような恩恵を非常に多く受けてある程度成果を出したと思うんです。

これがNaverでこの程度可能なら、他の会社はこれができるでしょうか?この程度の費用とこのようにすでによくできているサービスがない会社であれば。しかしAIは多くの場所で使われるのは確実なのに、その当時はAI導入に対する費用が非常に大きいと感じました。それが人材であれ何であれ。

そこで私はこのAI技術がもっと多くの場所に広がって、より多くのサービスが出てくることを願って、そのような気持ちでAI導入費用を下げる仕事をすればいいなという考えでUpstageを志を同じくする方々と創業しました。

それで私たちが今B2Bがメイン事業領域ですよね。技術を作ってB2Bで企業がAIを導入する時に、私たちがカスタムAIを提供したり、コンサルティングをしたり、必要なら私たちが教育も行ったりして、企業がAIを導入するのを助けるそんな会社を作らなければならないと思って、今創業してから4年半を超えて熱心に取り組んでいます。

わあ、4年半でもうほぼ国内代表主自と言えますよね、AI企業として。

そう呼んでいただければ感謝します。

国家AIプロジェクトと月世界最高LLM

それでは大韓民国のAI現況と展望について話し合ってみるのがよさそうですね。まず最近話題になっているニュースがあります。最近国家AI委員会でAI国家代表プロジェクト「月世界最高LLM」がかなり話題です。現在有力候補としてUpstageが言及されているのですが、まず月世界最高LLMが具体的にどのようなものか紹介をお願いし、このプロジェクトを通じて月世界最高なのでOpenAIやGoogleのようなビッグテックの超大規模AIも超えることができるかも気になります。

まだ正式事業公告が出ていないので、間もなく出ると聞いていますが、まだ変わる余地が多くあると聞きました。しかし今ハイレベルで大きな趣旨については既に多く共感しているのですが、それから説明すると、AI技術が国家の立場から必ず確保しなければならない戦略的技術として見ることができるんです。

これが国家の基盤となる技術で、国家競争力と連結されている技術なのに、これがグローバルレベルで遅れをとってしまうと、国家競争力とも密接に影響を受けるので、これがある程度国家の助けが必要だという認識が実は韓国だけでなく、既によくやっている米国、中国、その他多くの国でこのような意識が多く広がっています。

しかしこれがあまりにも資本力が必要な仕事なので、多くの企業に恩恵を与えるよりは、少数の企業に助けを与える、そのような選択と集中形式で少し展開される傾向があります。

そこでよくやっている企業、可能性のある企業を少し選別して、その企業にデータ購入費用だとか、人材採用費用だとか、当然GPU費用などを支援して、グローバル水準に遅れをとらないファウンデーションモデルをよく確保しようという趣旨です。

これがファウンデーションモデルがある程度グローバルレベル水準に備わったものが出てくれば、その次はおそらく差別化を検討するでしょう。つまり差別化というのは実際何か差別的です。さらにファウンデーションモデル水準があるものを確保した後、ファウンデーションモデル自体をオープンしてもよくやります。これは実際現実的に少し難しい目標でしょうが、ある程度の水準に作った後、このような部分でさらに差別化させれば、その部分においてはグローバルに勝てるそのような技術が出てくると期待していますし、ある程度そのような共感帯が政府側でもあるようです。

これを市場の論理に任せるには資本が少し多く必要です。それで政府の介入があるのですが、これは韓国だけの状況ではなく、私が知る限りでは日本、シンガポール、ヨーロッパなどでもすべてそのような方式で運営しています。

ああ、すべて似たように推進しているんですね。私が把握したところでは、私たちも日本支社があるので、日本の話もよく聞きますし、よく知られているMistralのようなものはフランス政府の支援を非常に多く受けましたよね。それではフランスにMistralだけがあるのかというと、そうではないでしょう。言われた時、これはある程度選択と集中は必要だと思います。それで日本は相対的に少し大きく支援する方ですが、それでもある程度少数の企業に支援する方です。

政府支援の具体的内容と企業への影響

それでは政府がUpstageのような国内代表AI主自に支援する時、どの部分を重点的に支援すれば企業の立場で良いか、それも気になります。どの部分が最も実務的に有用でしょうか?

これは企業別に置かれた状況が違うので、意見がかなり分かれる部分だと思います。しかし当然共通的な部分があります。何かというと、GPU費用がとても多くかかります。それでGPUは必ず必要だと言うので、GPU費用を支援してくれる、GPUを支援してくれるのは、おそらくどの国でも共通の支援政策だと思います。

細部的な政策は少しずつ違うと思いますが、まずUpstage基準でもう少し話すと、私たちがAIをやっていますが、B2B会社が先で、手段としてAIを使うんですよね。そしてB2B会社以前に、まず生きているスタートアップです。スタートアップは生き残るのが一次目標で、成長するのがその次の目標でしょう。

まず生き残るという基準で見た時は、売上がある程度出なければならず、費用が減らなければ、これが純益が出ながら大きくなるんですよね。今AI開発する時の費用が何かというと、GPU、人件費です。それではこのような部分において助けを受ければ、当然私たちの会社の立場では少しランウェイというのですが、それを保用を減らす方式で支援を受けるのがあるでしょう。売上をある程度確保するのも良い方法だと思います。

代表的に日本では私がカドラで聞いたのですが、国防では実際外産を使うのが少し難しいですよね。それなら絶対国内になるので、いくつかの企業にその国防部に該当するLLMを使用するその事業は与えるという、ある程度のコミットがあると聞きました。

これはある程度、何かすぐに売上が確保されたものではありませんが、可能性が高く売上がつくものですよね。それなら費用があってもたとえ売上が大きくなるので、また純益が出ながらまた色々なことをまたさらにやってみることができるでしょう。それでこのような二つの側面がすべて支援が必要だと思います。

もう少し細部的にいくと、私たちは米国支社があり、日本支社を設立し、そして開発者はすべてリモート勤務をします。創業初期から今までそのように運営したのは、グローバルにいる良い人材を採用して一緒に働ける文化やそのようなものを作るには、リモート勤務をセッティングするのがはるかに楽だと判断したからです。

来られる方も大部分またビッグテックを経験された方がいらっしゃいます。それならそのような方を私たちが採用する時、実際年俸を合わせるのが少し難しい状況ですよね。それでストックオプションを出しながら多く解消したのですが、いざストック行使を少し詳しく調べてみたら、税金関係が複雑でした。

海外で勤務される方に韓国企業のストックオプションを与えた時、税金が複雑で税金を多く取られるそのようなものでした。それならその方の立場では効用が落ちたんですよね。そのストックオプションの武器が。つまり私たちもそれで引っ張ってきたのに、いざやろうとしたら税金が大きく、それなら持っていく金額が大きくないので、これは私たちが本当に現実的に感じる困難です。

それでそのストックオプションやそのRSU活用がもう少し柔軟によく行われればいいなという希望があります。

また二番目は、私たちがB2Bをやっているので、最も大きな困難の一つが、まだその国内AI生態系が少し成熟していません。そうすると私の立場では売上を出すのが少し難しい状況ですが、これもある程度政府で呼び水になってくれれば、例えばバウチャー事業のようなものも多くやっていましたよね。

しかしそれが少し私たちの立場で見た時、もう少し効率的に効用があるそのような支援があるなら、企業がAIを導入するのにもう少しオープンになると思いますし、それなら私たちも少し息がつけると思うのですが、これはAI B2Bをやっているスタートアップ代表の方は皆似たような考えをされています。

そうでなくてもB2Bが難しいのに、時間がかなりかかる作業なのに、AI B2Bをやっているので、これが売上が出るまで時間がとても長くかかるのに、費用はまたそのAI開発費が大きいので、このようにランウェイがとても短くなって大変な場合が多いんです。それでそのような方面でも助けを受けることができるのではないかと思っています。

ソブリンAIの必要性

ああ、バウチャー事業というのは、事前に政府である程度支援してくれて、AIを使えるようにしてくれる制度ですね。これは今もありますが、私たちが感じる効用性が、特にLLM側は効用性が少し落ちるようです。これがLLMがない時にセッティングされたその支援制度ですから。それでGenAI時代に合わせて少しもっとそのようなものが修正されればいいという願いがあります。

ああ、その次に今AI関連で実際米国、中国のようなビッグテックのAIモデルを使用すればはるかに効率的ではないかという意見があるので、それでもUpstageは韓国自体AIモデルであるAIのようなものを主張していらっしゃるのですが、韓国自体AIモデルとソブリンAIのようなものに対する必要性について説明してくださると良いと思います。

このAIがあまりにも破壊的な技術なので、多様な観点の解釈があると思います。代表的には私は二つに分けて見ることができると思うのですが、一番目は市場の論理に合うようになること。それならどうせAIアプリケーションサービスを作る立場では、安くて性能さえ良ければそれを使うんですよね。それが韓国産であれ外産であれ。それで市場の論理に合う部分が確実にあると思います。

しかし確実に国家戦略的側面でこの技術を見て、ある程度の技術を内製化して確保しなければならない側面があると思います。代表的なものが政府関連公共機関でこれを使用するようになる時、その外産に依存するようになると統制力が落ちるんですよね。

それで多く出る例として、それならそこがサーバーダウンすれば政府の仕事がすべて止まるのかから始まって、色々なことがあるでしょう。それでその程度の統制力を持つ内製化されたAI技術は確実に必要だと思います。

これがある程度、それでは強力に必要かと言った時は、私はかなり強力に必要だと主張する方ですが、これを私はどのように解釈するかというと、IT技術それ以上に破壊的な話が多いですよね、AI技術が。それなら私たちが実際時間をさかのぼって生各してみると、もう少し理解できると思います。

私がよく使う比喩が何かというと、IT技術、インターネット技術が入ってきながら私たちが働く方式が多く変わりましたよね。メールも使うだろうし、今メッセンジャーを使っているし、このようなものを多く使っているじゃないですか。実際これはすべてインターネット通信技術ができながら私たちが業務をする時活用したツールですが、もし時間を戻してその時点でIT技術を導入した政府と導入しなかった政府がもし何か政策論議をするとしたら、業務効率が非常に違うでしょう。それなら交渉力も違うかもしれません。

このような差がAI技術を積極的に導入して政府とか公共で仕事をする時、AI基盤で何か仕事をすることができる方の競争力と、そうでないところとは、この比喻よりもっと大きく差が出るかもしれないと思うんです。それならこれは本当に国家のある大きな競争力と関連している部分ですよね。

それほど破壊的な技術なので、最小限のそのような公共や政府で必要なそのような使用処においては、内製化された技術が必ず必要だと思います。

しかしそれを使用することにおいて、持ってきて使う方案もあると思いますが、詳しく見るとそうでない場合もあると思います。これは私が知っている知人の中の一人が、ウクライナ出身で、シリコンバレーにいる開発者の方ですが、その方がウクライナLLM開発をすると言っていました。

ウクライナ語がロシア語と非常に似ているそうです。それでウクライナ語で質問すれば、大部分「答えることができません」が出てくるそうです。ロシア語だからロシア語のように思われるかもしれないので。それでこれを作るしかないと言っていました。

ああ、それならそうかもしれないと思いました。それであまりにも極端な例かもしれませんが、実際起きていることでもあるので、特にその統制力部分で、これを私たちが望む方向に持っていくためのものがどれほどよくやってくれるか、早くなるか、これがすべて国家競争力と密接にあるので、それである程度のその統制力は私は必要だと思います。

ああ、そのように何か国家間の戦いで実際本当にそれを手段としてAIモデルの特定国家に対するある偏向を与えたり、すれば持っている国家で統制してしまうことができますね。

意図しようと意図しまいと、そのようなことが起きることがあるじゃないですか。それなら少なくとも最新オープンソースモデルを受けて望む方向通りに作ることができるように。それが私はソブリンAI、ソブリンLLMをする時必ず備えなければならない内製化しなければならない技術力だと思うんです。

最初から作るのであれ、与えられたものがある時、これが私たちがこの部分は偏向性を減らしたい、この部分はもっと伸ばしたい。それが我が国が最初から作るとしても、それが時代によって要請によってこれを続けて変えながらアップグレードしなければならないじゃないですか。

つまりそのアップグレードをするということが、私たちが望む通りにこれを触ることができるか、コントロールできるか。これがソブリンのマストキャパビリティではないかと思います。

ソブリンAIの実現方法論

ソブリンAIについても意見が分かれますね。完全に本当に底からできなければならないという側と、オープンソース公開されたものを利用してファインチューニングできなければならないという側がありますが、どう思われますか?

私は実際両方とも必要だと思います。つまり私はこの二つの根幹はそのモデルを、先ほど申し上げた通り統制できるか、統制するということは私たちが望む方向に能力を引き上げることができるか、これが核心だと思うんです。そのハウにもう少し近いと思います。

ファインチューニングでやるのであれ、スクラッチからやるのであれ、何をするのであれ、これはハウに近いのですが、今出ているハウは実際すべて備えるのが国家の立場では国家競争力に該当するでしょう。

例えばある時はファインチューニングで引き上げるのがもっと合う時もあり、ある時は何かプリトレーニングをもっとしてこの能力を引き上げるのがもっと合うこともあります。これはハウなので、何でもすべて通すハウがあればみんながグローバルにそれだけやっているでしょうが、そうではないので方法は続けて変わることがあります。新しい技術が出ることもできるし。

しかしそれを吸収して私たちのモデルを私たちが望む方向に作ることができるか、これがソブリンの核心ではないでしょうか。それをそれではどうやるかで、色々なアプローチがあるでしょうが、国家次元では色々な方法論をすべてできる技術をすべて持っているのが実際良いと思います。

国内AI市場の現況と展望

国内代表AI企業でいらっしゃるので、国内AI市場の現況と展望についても伺いたいのですが、現在AI現況がどうで、どのように変化すると思われますか?

私たちが主にB2B中心に見ているので、B2Bをしながら感じた雰囲気を申し上げると、当然AI技術が早く発展するので市場環境が非常に早く発展するのですが、これが国別に少しずつ反応が違うようです。

私たちが米国事業もして日本事業もして韓国事業もしているので、雰囲気をすべて見ているのですが、まず韓国基準で申し上げると、今年は少し様子を見ようという雰囲気が多くありました。つまりAI技術を導入して適用してみなければならないのに、これを少し様子を見ようかというこのような姿勢に少し変わったのですが、昨年は少しそのような試みが多くありました。POCもやってみて色々なこともやってみたのですが、今年は少し待ってみようという雰囲気がもっと多いのですが、私が見た時は大きく二つの理由があるようです。

一番目は特にLLMを導入するということは、企業の立場では少し大きな投資が入るということですが、そのような大きな投資をするもの対比ROIが出るだろうか、つまりこのようなビジネスバリューを持っていけるだろうかという確信が少し落ちた状態のようです。それでこれが投資対比効果があるだろうかという考えが少しあるようです。

その次に二番目は、技術が早く発展するので、今導入したものがすぐ無意味になるのではないか。それでこれがしかしすぐ収束するのではないか、このような考えもされるようです。それで早く導入するのがむしろもっと非効率的かもしれないという考えもされるお客様がもう少し多くなったようです。

それでこの二つの組み合わせで少し待ってみようかという雰囲気に流れていったようでした、今年は。しかしこれが続けてそうではないと思いますし、保険業界で例えれば、ある保険会社でLLMを成功的に導入して実際このようなバリューが出たという噂が広がれば、また競争的にこのようにされるでしょう。

それで先ほど私が政府支援の時も申し上げましたが、このような呼び水が非常に重要です。しかし私が見てもある程度懸念事項が少し解消される時点が今下半期に来ると思います。

つまり私たちが私たちも新規モデルが出れば、私たちも多角的に分析するのですが、だんだん一般的に使用するには性能がある程度収束していく様子が見えます。しかし例えば一般的な業務をするのに大学数学程度の能力が必要かわかりませんが、博士級数学能力が必要でしょうか。それならそうではないと思うんです。

それである程度ジェネラルに使用される時の性能はある程度収束したのではないかと思いますし、それならもう少し企業の立場でも導入にもう少し積極的ではないでしょうか。またウェイト・アンド・シーをされながらもじっとしていらっしゃらなかったんです。このような技術がこの程度性能が上がってくれば、ああこのようなバリューがあるだろう、このような内部ケーススタディも多くされると知っています。

そのようなものがまた積まれて、技術がまたある程度ちょうど合うようになれば、多くのケースが実際実証事例が下半期にはある程度出てくると期待しています。

ああ、本当にあまり残っていませんね。

実際AI企業が次々とすべて入っていく時点になると思います。

AI創業に対するアドバイス

良いです。それでは国内でAI側で創業したり、自分のサービスを準備される方が多いでしょう。なぜならAI時代が来ながら、以前スマートフォンが登場した時アプリを出して非常に成功された方が多いように、今回AI時代に合わせてAIサービス、このようなものを準備して成功を狙われる方が多いでしょう。このような方にAI業界の先頭の立場でアドバイスを与えることができるなら、どのようなアドバイスを与えることができるか気になります。

最初に思い浮かぶのは、まずグローバル市場を狙って出発するのが私には合って見えます。これがあまりにも当然の答えかもしれませんが、私はこの答えをどのように解釈して受け入れて、またどのように解釈されればいいかというと、AI技術が国境に障壁がないという話が多いじゃないですか。

つまり反対に言えば、私が韓国だけやりたいとしても、色々な外国企業が韓国市場に入ってくるのがはるかに容易だということになります。それで韓国に集中すると言っても、私がグローバルに一度戦ってみようという考えでやらなければ、韓国である程度のそのようなバリューを作り出すことができると思います。

特にAIは、そしてAIによるユースケースが、ああこのような所でこのようなバリューがあった、このようなものがよくできた、これがまたグローバルに通じるようです。それで以前は韓国の事例を日本に植えようとすれば、ローカライゼーションを少し多くしてこのようにしなければならなかったのですが、今はAI基盤のあるサービスやこのようなソリューションは、この国でできればこの国はほぼコピー&ペースト、すぐこのような感じも私はある程度あると思います。以前の技術に比べては。

そうすると韓国で成功しても他の国で何が成功しているか、このようなことも注意深く見なければならないようですし、それなら我が国もこのようになるだろう、このようなことがはるかに容易な状況ではないでしょうか。

それで私は韓国だけを見ても、グローバルに見なければならず、当然韓国でよくできればグローバルでも通じるという話なので、それならなぜしないじゃないですか。グローバルにやってみようというマインドは最初から備えていただければいいというのが私がしたい話です。

ビジネス戦略とSolarモデルの成功

良いです。その次にビジネスとグローバル戦略関連で話し合ってみると良いでしょう。UpstageのSolarがLLMを始めてから6週間で出たサービスだと聞いていますが、しかしHugging Face Open LLMリーダーボードで1位をされました。わあ、それでこのように短い時間で高い水準の成果を上げるようになった秘訣が気になります。

Hugging Faceリーダーボード1等を取ったのが実際計三回あります。それで一番目に1等取ったのが6週間でしたのが、その当時はHugging Faceリーダーボードがそれなりにグローバルに認知度がある状況だったので、多く話題になったのですが、どのようにそうなったかと言った時、少し当然の答えかもしれませんが、AIをよく作るために3大要素が必要だと言うじゃないですか。人材、データ、インフラ。この時AI をよく作ることができる、このように話をするのですが、その当時私たちの会社の立場では実際人材は私たちがB2B継続技術基盤のB2Bをやっていたので、人材もあったと判断されますし、インフラもその当時私たちIDC、私たちの会社のデータセンターにもかなりあったので、大量の実験を早く回すことができる状況、つまりLLMOpsと言いますが、これがすでに構築されていました。

データ側面では、その時は少し公開されるデータ中心に私たちが早く結果を見るためにやったことなので、データは大きく差別点がありませんでしたが、私はデータよりは少しその開発文化を挙げたいです

つまり何かというと、私たちはできるだけ先導的な技術を作りながらそれをB2B事業に入れようとしているので、少し先に行くということは、何か更地でヘディングすることが非常に多いんです。つまり例えば最初プリトレーニングする時、誰もやったことがないんです。私もやったことがないし。しかしやらなければならないじゃないですか。

つまり会社でやろうと言ったら、何とかしてやり遂げなければならないんですよね。つまりこのように答えはないのに何かやり遂げなければならない状況、私はこれを更地にヘディングする状況と言うのですが、これが実際AIをやっているとすごく多いんです。新しいものが続けて出てくるので、何かMCPが出た、すぐサービスもラップ、知らないけれど勉強しなければならない、このようなことじゃないですか。

よくやりそうですが。

それでこの更地にヘディングすることが重要ですが、無知にやってはいけないと思うんです。賢くよく更地にヘディングをしなければ会社の競争力がもっと生まれると思います。どうせ更地にヘディングは誰もがすべてやらなければならない状況ですが、どうすれば効率的によくできるかを常に悩んで、そのような文化や働く方式を備えようと今も努力しているんです。

それが最もよく現れたケースだと思います。私たちもLLMを一度やってみようとした時、知っている方も誰もやったことがないのに。しかし私たちは更地にヘディングするのに慣れているじゃないですか。それで集まって、それではこれ更地ヘディング、どうすればもっと効率的にできるか、このようなことを論議して集まって熱心に走った結果、6週間でやったんです。

しかしこれも働く方式やこのようなこともあるでしょうが、参加される方もそのようなマインドセットが少しできていなければならないじゃないですか。私は更地にヘディングするのがとても好き、このようなこともあるでしょうが、私がお願いするのは、あまり不便がらなければいいと思います。

つまり更地ヘディングすることが不便でしょう。しかし業務に支障をきたす程度にだけ不便でなければいいと思います。もしその程度に不便なら実際AI側とは少し合わないかもしれません。続けて変わって適応しなければならないので。それが開発であれ、私たちの会社のような場合事業開発であれ、何であれ、続けて新しいものが出れば、その方もすべて新しい環境です。

それでAI時代にいらっしゃる方に対するある共通的に必要な資質だと思います。

データ戦略とパートナーシップ

それではファウンデーションAIモデル関連では良質のデータ確保が必須的だと知られていますが、韓国語データがまず多くないと知っているのですが、どのようなデータを利用して普通学習を活用されるか気になります。

これはライセンス問題ない公開されたデータを活用するのは、当然みんながされるでしょうし、私たちもやっています。その次に私たちが重要なデータソースと考えているのが、B2B事業をやっているので、B2B事業を通じて確保されたデータがあります

例えば代表的に朝鮮日報とも契約を結んで言論社特化LLM開発を一緒にやっているんです。その時朝鮮日報側にあるニュースデータを私たちがすべて受け取ることができました。そのようなものは他の企業では容易ではないデータなので、このような方式で顧客と直接色々な事業をやっているので、そのようなお互いのニーズに合って顧客会社データが移ってくる場合があります。それなら、これは良いデータですよね。

そうですね。これはどこからも持ってくることができない。

ある意見で、パブリックデータがもっと多いか、プライベートデータがもっと多いかといえば、誰かはまたプライベートデータがもっと多いだろう、企業内でどの程度データを公開するか、このような話もあります。それで私たちはすべてのプライベートデータをすべてアクセスすることはできませんが、私たちと関係があられる方、そして共同事業をするそのようなパートナー会社から受け取るデータが私たちにはかなり重要なデータソースだと思います。

そうですね。それは何かGoogleやOpenAIも絶対持っていけないデータですね。

そうです。それでは重要なのが韓国語データがおそらく多くないと知っているのですが、韓国語データなしでも良い性能を韓国語で出すことができるでしょうか?

ああ、これは何か、すべての開発者に聞けば、データは多多益善だと言います。確実に韓国語データも多いほど良いと思います。しかし私たちが観察するのが何かというと、フロンティアモデルの学習データの言語別比率を見ると、当然英語が高いじゃないですか。しかし最近OpenAIやこのようなモデルを見ると、韓国語も非常によくできるじゃないですか。

つまりデータ比率上、韓国語が多くならなければならないかといえば、そうでないかもしれません。しかし絶対点だんだん多くなっています。最初にはLLaMA 2が出る時は1兆トークンだったかな、このように2兆トークンで学習したとすれば、最近は無条件10兆トークン以上ですべてプリトレーニングします。つまり絶対量が続けて増えた状況のようです。

それで私が思うのは、まず韓国語側面でもう少しよくしたければ、ある程度また基本はすべてやってくれなければならないと思うのですが、これが基本をするためには実際英語データがむしろもう少し重要に見えます。そのケイパビリティ観点では。

それで英語はある程度少し基本になるそのインテリジェンスケイパビリティに関連した内容なので、これはある程度よく確保しなければならないようですし、その次にこれを言語別にすべて発現させようとすれば、最小数量以上のある各国別言語が入ってくれなければならないのですが、これが当然多いほど良いのですが、それならこれが英語ほど無条件なければならないかといえば、その程度ではないかもしれません。しかし絶対量は多いほど良い、程度に私は解釈しています。

しかし私たちが冷徹にまだSolarが何かOpenAIモデル程度ではないので、まず韓国語データを無条件増やして韓国語を上げなければならないよりは、ただジェネラルに使用される時ケイパビリティを上げるために英語データをもう少し気を遣ってやって、韓国語データも当然私たちが確保されたものを最大限入れてみようと努力していますが、無条件韓国語データをずっと上げることにまだ優先順位を置いていません。

つまり私たちがそのようにできるとしても、まず使えるものが重要なので。仕事がよくできる韓国語話者か、外国人と仕事をしたいか。韓国語は非常によくできるけれど仕事ができない子と一緒に働こうとすれば、仕事がよくできる方が先でしょう

しかし私たちがB2Bをやっているので、そのB2Cサービスは少し違う観点で見ることができます。しかし私たちはB2Bをやっているので、仕事がよくできるのが問題ですよね。

そうですね。一緒に仕事する時使おうとするものなので。

それで私はそのように解釈しています。

企業協業事例と特化モデルの優位性

それでは Upstageで国内企業と多様に協業していると知っているのですが、自体AIモデルを提供した代表的な事例があるとすれば、どのようなものがあるか気になります。

朝鮮日報事例を申し上げると良いと思いますが、朝鮮日報と一緒に私たちが朝鮮日報側からデータを受けて、私たちはベースモデルとGPU、人材を出して、言論社で使用するのに適合したLLMモデルを一緒に続けて作っています。

記事を書いてくれるのですか?

一番目に今私たちが適用したのが何かというと、校正です。記者の方が草案を作成されれば、デスクで言う口調のスタイルを変えたり、文法的に間違ったものを修正することも当然ありますし、その次に事実如何も何かチェックするのがあります。例えば記者の方がざっと書いて忠北鎮川、このように書きました。それなら鎮川が忠清北道ですか、南道ですか?

ああ、わかりませんね。

このようなファクトチェックも入らなければならず、それなら日付も2025年5月5日とした時、誰かは2025年5月1日とするだろうし、誰かは25年5月5日とするだろうし、これが少しスタイルが違うじゃないですか。しかしそのようなことも少しその統一感を与えるためにスタイルも合わせるのがあるそうです。

これをすべて見るのですが、記者の方は多いのに、その校正をしてくださる方が少し数が少ないので、そこが少しボトルネックになると言われました。記事草案と校正された結果はデータセットを自由に構築しておかれていて、これを持って私たちが校正する、校正をするモデルを作って、それがかなり結果がよく出て、他の言論社でも多く使われそうなので、これは共同事業を進行しています。

ああ、そのように確実に特化して作れば、一般的に何かGeminiやOpenAIやこのようなものを使うよりもはるかに良いでしょうか?

性能が良いです。そこだけのデータが入ることもありますし、このようなタスクが実際ジェネラルに少し難しいタスクでしょう。文法校正は何かよくやるでしょうが、スタイルを合わせるのは2025年5月5日とするか、25年5月、これは何かマーカー間違いの問題ではないじゃないですか。しかしそのような式のその校正問題がまたかなりあるので、そのようなものに合わせて評価をすれば、特化されたモデルが確実に性能がもっと良いです。

B2B AIの課題と解決策

ああ、それではまた、AIをB2Bでされる立場で、また最も大きな問題と思われるのが、実際会社ごとにやることがあまりにも違うじゃないですか。産業も違うし、文化データ、このようなものがすべて違うでしょうに。このようなところで、AIをすべて供給されながら、企業がAIを導入する時、最もよくぶつかる問題点があるとすれば、どのようなものがあるか気になります。

二つの側面があるようです。つまり顧客会社側面で私たちが見る問題点があり、私たち自身を見た時生じる問題点があるようです。

まず顧客会社側面で申し上げると、AIに対する理解度、あるいは準備された状況が顧客会社別に非常に違います。それなら私たちはAI技術中心にこのように販売をやっているので、この技術がこの程度価値があります、なぜならこれが100万ウォンです、と言えば、顧客会社も100万ウォンなんだな、と言ってこれを買われるでしょう。

しかし私たちは100万ウォンと言うのに、ここで急に顧客会社は1ウォンと言えば、ギャップがとても大きいじゃないですか。それならこれを説得しなければならないじゃないですか。これがこのようにしてこのように価値があります、このような作業が普通前の部分で起きます。

それならお互い理解度が既に高い状態なら、100万ウォンと言ったのに、ここで90万ウォンと言えば、すぐできそうじゃないですか。内講のようなことも、これは一つの例で、つまり顧客会社がAI技術やソリューションの理解度が千差万別なので。

それでその助けを差し上げるために、例えば私たちがサイドでやっている教育事業に該当するその作られたコンテンツを、AIはこのようなものです、このようなコンテンツを少しもっとその企業型に合わせて私たちが提供したりもします。

あるいはまたこれが100万ウォンです、と言った時、技術自体を見るよりは、結局これを導入した時100万ウォン以上の価値がなければ購入をされるでしょう。それならこの技術を持ってきてどのように使うかに対するユースケースがかなり多く出てくれれば良いのですが、そのようなことも少し難しくて。

理解度が少しない顧客は、それなら私たちが何かワンデイワークショップ、このようなことも、ディスカバリーワーク、ユースケースディスカバリーワークショップのようなこともやったりして、そのような方式で時間を節約しようとする努力があります。

私たちの側面で見た時の問題点は何かというと、私たちもそちらの顧客の方が属しているドメインに対する知識が多く必要だと思います。これが私たちもこれが100万ウォンですが、実際これがみんなに100万ウォンではないと思うんです。

あるビジネスドメイン、例えば金融圏ではこれが1千万ウォンかもしれないし、物流側では10万ウォンかもしれません。そのビジネスバリューがすべて企業別に違うだろうから。それなら私たちがそちらのドメインに対する理解度が高いなら、私たちが最初から100万ウォンを言わないでしょう。

もう少しよくドメインに対する知識が私たちも積まれなければならなくて、それで私たちはそれを少しそのビジネス領域を一つずつ少し占領しようと努力しています。あまり広げるよりは、今私たちが大部分金融圏中心に今まで多くやって、それで保険業は今かなり多く私たちも知っていると思いますし、保険出身の専門家の方も会社にいらっしゃいます。

それならその方が話す時はるかに容易じゃないですか。そのようにして少しずつ移って、銀行、その次に製造や物流、このような方式で少しずつ拡張しています。私たちが広げておけば、私たちもドメイン知識がすべてないので、私たちも管理ができないようです。

それでこのように二つの側面の努力をしています。

グローバルビッグテックとの競争戦略

グローバルビッグテック企業が先を争って、お互いがもっと良いと言いながら続けて良いモデルを発表しているじゃないですか。そうすると、このようなビッグテックと競争することにおいて、差別点を確実に持たなければならないと思うのですが、差別化された競争優位を持続的に確保して成長するために、どのような戦略を取られているか気になります。

前でも申し上げましたが、差別化を感じられるのは、基本はすべてやってくれなければ、その次にこれが差別的だと言った時もっと響くようです。それで会社内部的には、フロンティアモデルの水準を追いかけるための努力を実際続けてやっています。

しかしそれが到達がすぐできると信じて、その到達した時は、それ何で差別点を見せるかも一緒に私たちが見ているのですが、やはり今売上が多く出る側が従来のドキュメントAI、その文書画像を持って業務処理をするのを自動化されるのを助けるそちらを多くやっているので、文書基盤の業務をする時助けになるそのようなLLMであれ、何かAIを作ればはるかによく作ることができるのではないでしょうか。

なぜなら私たちが従来に既に多くの顧客事例があり、そのドメインが解決したい問題もとてもよく知っているし、なぜなら顧客会社に会ってみればすべて使ってみるんです。ああ、GeminiやOpenAIが新しいものが出るのに、このようなことがまだできなかった、このように話されれば、私たちもそれで何ができないということを少しライブに聞くじゃないですか。

それなら私たちがそれを解決してくれることができれば、そちらのドメインでその顧客には確実に差別化されたモデルになるので、それで私たちが文書基盤でする色々なタスクで少し差別点を持っていけばいいと思います、と言って熱心にまた努力していますし、その代表的なのが私たちが今ビジョンランゲージモデル、マルチモーダルモデルも作っています。

熱心に。しかし私たちは一般的な画像を理解するのには関心がなく、例えば文書画像を見せた時、相当な質問にすべて答えることができる文書画像特化ビジョンランゲージモデルを作るのに現在非常に集中しています。

それならそれがよく出てくれれば、Excelであれ、100ページの報告書であれ、チャート、数式、グラフなどすべて理解して、相当なユーザークエリに対して答弁できるモデルが出てくれれば、それは聞いたことがないでしょう。何か既存のビジョンLLMよりよくやります。

しかし私たちがもう少しよく作ることができるなら、確実にニーズもあって、その次にもう少し差別化されて見えるそのような技術ではないでしょうか。そのように思って熱心にやっています。

データセキュリティとプライバシー対策

またAIが続けて発展して便利になるほど、実際個人情報のようなもののイシューも多いようですが、データが漏出するかもしれないと心配して、最近SKT事態もあって、データ漏出のようなことも心配される方が多いようです。

それでB2B企業をされているUpstage側面で、顧客を安心させるために設けたセキュリティだとか、事故防止のような対策があるか気になります。

私たちが売上が出る構造を見ると、まずオンプレミス事業があります。そのオンプレミス事業は顧客会社IDCに直接AIモデルを設置してくれることなので、セキュリティイシューが実際は当然デリバリーする時、その顧客会社別に備わっているセキュリティその審査テストがあります。その中では企業で要求されるそのような要求事項を充足させようと努力していますし、売上が出るということは既にそのようなことを私たちがすべてやり遂げているということなので、それがあるでしょう。

主に問題になるのがSaaS形態で使われる時の顧客会社データがどのように処理されるかですが、そうすると私たちがSaaSも主にそのエンドポイントをCSP、Amazonやこのような有名なところでやるのがありますし、そこは今そちらのセキュリティ体系に従うことなので、信頼できると見ることができます。

私たちが運営するデータセンターを通して出ていくものもあります。しかしそれもセキュリティを充足させるために私たちがグローバル標準であるISO 27,000台のその標準のその認証も私たちがすべて受けて続けて維持しています。

そうですね。しかしこれが米国事業、日本事業のようなことも作っているので、顧客会社がそのようなことを要請します。あなたたちは何の認証があるか、なければ私たちのデータをあなたたちに送れない。ああ、かなり厳しい顧客はかなり多くの認証を要求されます。

それなら私たちはCSPに上げて実行させ、そうでないものは私たちがまたして、何か。ああ、確実に少し違いますか、韓国に対して。

そうです。つまり大きな会社ほどグローバル事業をされているので、色々な国の要求事項を一度に要求される場合があります。韓国基準、米国基準、例えば日本基準、三つすべて充足される、このようになれば、このようになります。

ああ、しかしCSPはそのようなことをすべて備えているので。すべて備えているので。

海外進出戦略とグローバル展開

またUpstageは申し上げてくださった通り、米国と日本側にも進出していらっしゃるのですが、Upstageでの海外進出戦略はどのようになっているか気になります。

私たちが米国、日本にあるのですが、確実に国ごとに雰囲気が少しとても違うようです。つまりChatGPTがもう4年近くになりましたね、出てから。出た時、実際グローバルに同時に叩いてきたじゃないですか。2、3年になるまではすべて似たような雰囲気でしたが、今は各国別に戦略があり、各国の生態に合わせて少しずつ違うように動くようですが。

まず米国を見ると、少し早く動くのは確実なようです。米国なので。それで私たちが集中的に見ている部分は実際そのエージェンティックフロー、そのエージェントを色々なツールをマニュアルに組んで、あるアプリケーションレベルに作り出す、悪く言えばAPIラッパーと言いますが、最近はそれがもっと米国では通じるようです。

例えばCursorや、このようなものはすべて自体モデルではないじゃないですか。ああ、そうですね。非常によくやっているじゃないですか。そのそのような事例が非常に多いだろうと米国は期待しています。

当然私たちはAIも作っているので、そのエージェンティックフローに私たちのモデルを今はめます。それでこのように構築するのですが、私たちが主に見ているのは、先ほど申し上げましたが、文書基盤で何かをする時、エージェントフローでこのように構築すれば、顧客会社が解決したい問題が解決される、このようなことを今多く見ています。

その次に日本は少し韓国と似ているようです。しかし相対的に少し遅いようなので、それで米国と韓国の成功事例があれば、おそらく日本にそのまま少し複製できるのではないかと期待していますが。

しかし日本もLLMを見ると、少し戦略的資産として見る傾向がまだ少しもっと強いようです。それで私たちが韓国企業だと言った時、少しこのようなこのような感じがまだ少しあるのですが、ずっとそうではないと思いますが、とにかくまだそのような感じが私たちにあるので、今は私たちがドキュメントAI中心に押しています。

しかしドキュメントAIをやっても、先ほどエージェントフロー申し上げましたが、そこに私たちのLLMも入ってくれます。それならただその問題を解くのに一つのモジュールとしてLLMなので、このようになれば、また大丈夫なんです、顧客会社は。

それで日本は少しそのように見ていて、私たちの間で話しているのは、モデルプロバイダーか、アプリケーションをプロバイディングするかですが、米国は少しアプリケーションレベルのプロバイダーとして位置づけようとしていて、韓国と日本はまだまでモデルプロバイダーをやってもある程度売上が出そうな期待感があるので、それを先行的にやろうとしています。

AI時代の人材と必要スキル

その次にAI時代の対応方案というテーマでまた話してみましょう。やはりAI業界最前線にいらっしゃるので、それを多く感じていらっしゃるでしょうが、AI時代の人材定義、そして力量のようなものも非常に多く変わっている状況のようです。それで特にAI時代で最も重要だと感じる力量が過去に比べてどのように変わったか、このようなことも気になります。

確実なのはAI技術はもっと早く発展するということで、その話は今私が身に着けたものが無意味になる確率も高いということじゃないですか。それで新しいものが出た時、ああこれを私が身に着けなければならない、それならそれを身に着けるにはこのような資料があるんだな、ツールがあるんだな、このようなことを早くキャッチして自分のものにするこの力量が実際非常に重要になるようです。

以前は一つの技術を身に着けておけば、少なくとも数年、もっと以前はもっと10年、このように活用することができましたが、今AI側をされる方は新しいものが続けて出てくるじゃないですか。

それでそのようなものを早く見て身に着けて、よくある表現でラーニングカーブが良い、つまりその能力がもっと重要になるようです。今どのようなスキルを備えているかよりは、ラーニングカーブが良いか、これが一つの大きな軸として位置づけられています。

そして先ほど申し上げた通り、環境自体が更地にヘディングすることが多いので、それがあまり不便ではない人であればいいと思います。このようなことがあります。

AIプログラミング支援ツールについて

そうですね。それではこれと少し繋がって、実際最近コーディング側でバイブコーディングについて非常に意見が多いようです。それで非常にトレンドになっているのですが、このバイブコーディングに対する考えが気になります。

バイブコーディングは私はただ現在流行している用語だと思いますし、ただコーディングアシスタントAIが続けて何か発展しています。これをどのように受け入れるかで質問を変えて答弁すると、これは開発者はコーディングアシスタントでしょうが、最近デザイナーや他の方もすべてAIツールが多く出ているので、少し似たような状況を点点経験していらっしゃいます。

しかし私はこれをどのように見ているかというと、人を採用する時期待する最小水準が点点上がっている。なぜならAIツールを使用するのは実際あまりにも当然じゃないですか。しかしそのAIツールが発展するということは、このツールを使用するという仮定の下で、ある人を採用した時、コーディングで例えれば、コーディングの基本能力が、例えば以前はただジュニア1年次だったとすれば、今はジュニア1年次を採用してもたとえ以前基準で何かジュニア3年次程度の水準をする、そのツールを使うという過程でこのようになるじゃないですか。

これが発展すれば、ジュニアを採用してもたとえ以前基準で10年次水準はやり遂げなければならないんです。それでミニマムを上げています、このツールとして。つまりAI基盤のツールとして私はこのように解釈されます。

しかしそれが現在ではこの程度の水準になって、これを活用する方式が、バイブコーディングで呼ばれるある形態の方式で今使われているのですが、それならこれがすべてかといえば、当然すべてではありません。しかしそれはあまりにも当然なことで、それ以上の価値を実際してもらいたいと期待するものじゃないですか。

これは完全経営的マインドで話すと、一人を採用して週に何かの給料を与えるとすれば、AIツールを使う時、ある仕事を与えた時、これがどの程度かかって、どの程度水準になるか期待値が続けて変わるんです。それなら期間も実際もっと短くなることがあるじゃないですか。どうせ週実際時間基盤で仕事をするとすれば、残りの時間で何をもっと見せることができるかが、その人の差別化されたポイントとして解釈されるようです。

私はノーコードをすることもできるでしょう。しかしそれは普通40時間働くと仮定するなら、それなら残り何をして会社に貢献するかを自ら考えることができるか、あるいはそのような仕事を任された時できるか、このようになるでしょう。

採用におけるAIツール活用

それでは実際これも論争が多いのですが、そのコーディングテストのようなものもAIで突破するツールも出てくるようになって、そのコーディングテストが意味があるか、ないか、このような話が出ているのですが、UpstageではこのようなAIツール活用、このようなものを採用段階でも奨励しているか、このようなことも気になります。

私たちが明示的に表現しておいていませんが、私たちが採用段階を見ると、中間段階が何かというと、一対一深層面接があります。そのコーディングを手コーディングと言いますね。ああ、それを必ず入れています。

それで前でAIツールを使ってもいいです、いけません、このような話は私たちが設けていませんし、誰かは使われて、誰かは使いませんが、私たちも大体見れば、いや以前に中間段階で深層面接を通してツールも知って使う人と、ただ使う人がいるじゃないですか。

私たちは知って使うことを期待していて、知っているということは手コーディングをやってもやり遂げることができるということで私たちは受け入れて、それを入れているので、大きく採用段階で、どうせ検証されるだろうと思うので。

AI時代の基本スキルの重要性

それではこのようなAI時代、ここに合う力量を育てる方法はどうだと思われますか?

これも多様な答弁があると思いますが、ハイレベルで申し上げると、むしろもっと基本に忠実でなければならない時期が来たという考えがします。最初に私たちがMLOps、LLMOpsこれをされる開発者が必要でしたが、それをやってみた人が多くありませんでした。今も実際少し少ない方です。

私の立場で選択肢が二つがありました。ソフトウェア開発者を採用してAIを教えるか、あるいはAIをやる人を採用してソフトウェアを影響を育てるためにそのOps部分を担当させるか。

これが時間が経ちながらだんだん変わったのですが、これが変わるようになった理由がAIスキルを装着するのに必要な費用がだんだん減っているじゃないですか。それで以前はAI知識がある人を採用するのがもっと大変だったので、AI能力を育てるのがもっと大変だったので、その人にソフトウェアをもっと影響を育てるためにOpsを担当させました。今は反対です。

これが時代によって少しずつ変わっていくのですが、明確なのはAIを身に着けるのはだんだん楽になるでしょう。使うのも今は難しいかもしれませんが、楽になる方向に流れるでしょう。それならAI関連力量は既に過多だと仮定するなら、それなら私が事業開発をする時、AIツールを使うのはあまりにも当然。それなら残りの差別化は、これがミニマムで差別化は何かというと、どのように見れば事業開発の基本かもしれません。

顧客に会うスキルだとか、などなど。それでむしろもっと各職群別に基本に該当するその業のその職群の根源に該当することをもう少しよくされる方が、会社に必要な人材だと思います。これが当然あると仮定して、これがなければ当然採用されないでしょうし、むしろ基本に戻る時点が来たと思います。

AI知識の効率的な学習方法

それではAI業界が非常に早く変化しているじゃないですか。この膨大なAI知識を少し早く学習して、必要な内容だけどのようにサービスに反映していらっしゃるか、このようなことも気になります。

現実的にAIデイリーに出てくるニュースをすべてカバーするのはあまりにも大変な状況がだんだんなっているようです。それで私が普通お勧めする方法は、チョコーディングのように、ニュースをよくキュレーションしてくれるチャンネルや、インフルエンサーや、このような方が点点多くなっているのも事実です。

それで私は個人的にお勧めするのは、自分に合うそのようなキュレーションチャンネルがあると思います。それでそのようなものをよく探される、これが実際一番目にお勧めすることで、そのようなものが出れば、実際会社次元でも、それならそれぞれ聞く便りが多様にあるでしょう。

それが私たちの会社内部ではよく共有されます。つまり事業開発の立場で、ああこのようなものがあります、ニュースがあります、私が見た時、AI技術がこのようなものがあります、と言えば、そのようなことを会社内でもう少し共有するようになれば、会社の立場で必要なキュレーションを、それぞれある程度その職群に該当する無神の方がある程度してくださるんです。

それが集まれば、会社の立場で少しデイリーに見なければならないニュースがある程度はカバーされるようです。それでそのようなことを実際消化する時間が私たちの会社は少し定期的にあります。

その例えば技術ニュースが少し多いので、だいたい毎週そのペースを合わせるというコーナーをするのですが、主要技術ニュースを非開発職群が理解しやすく説明してくれるそのようなものです。デザイナーが開発することはありませんが、ああMCPがこのような概念なんだな、程度は知らなければならないでしょう、ある程度は。

それでそのような技術用語を少し解きほぐして説明してくれるそのような時間も設けようと努力するのが、すべてこのような努力の一環です。

Upstageの今後の目標と創業者へのメッセージ

向後Upstageで最も大きく立てていらっしゃる目標があるとすれば、どのようなものか気になりますし、また予備創業者、開発者の方がおそらくこれを多く見ていらっしゃるでしょうから、したいお話があるとすれば、お話をお願いします。

UpstageはAI B2B市場でグローバルB2B市場で意味ある結果を作り出すのが実際最も大きな目標だと思います。それで支社も設立しましたが、熱心にグローバルに結果を出してみようと熱心に努力中ですが、これが実際非常に大変なことです。実際米国事業も米国にいらっしゃる方が非常に苦労しています。

誰もが知らないじゃないですか。LLMをやるあなたたちが、なぜOpenAIとAnthropicがあるのに、あなたたちのものを何故使うか。そのような米国市場を突破するために多くの悩みをしていらっしゃいます。

私たちがそのような努力をするのは、どのように見れば私はこの比喩を好むのですが、プレミアリーグを考えてみれば、2部リーグに入るのと、2部リーグ1等と1部リーグ最下位と、私が知る限り売上差がかなり大きいです。その放送中継権連結、このようなものに比べて。2部リーグ1等になるために努力するよりは、1部リーグに何とか入って最下位でも1部リーグに入っているのが私はもう少し合うと思うんです。

しかし1部リーグに最下位なら、誰が見ても最下位チームと、誰が見ても1等チームが付けば、最下位チームは負けるつもりで競技しないじゃないですか。何とか勝ってみようとするじゃないですか。そうすると勝つこともできて、それが実際は私は差別化されたポイントで、ニッチマーケットである程度結果を出すのが、おそらくそのような状況で私は比喩を挙げることができると思います。

それで私たちも当然OpenAIがはるかによくて、OpenAIをはじめとしてフロンティアモデルをよくやっていますが、私たちも追いかけようと努力していますし、1部リーグに入るために、1部リーグに入ったという仮定で私たちは負けようとはしないので、私たちだけの戦略でまたやり遂げようと多様な試みを現在、先ほどのドキュメント基盤ビジョンランゲージモデルを含めて色々な試みをやっているので、多くの応援をしてくだされば非常に良いです。

それでそれが一つ私たちの大きな目標で、その次に予備創業者や開発者の方にお話ししたいのは、AlphaGoの1年前から本格的に始めました。私の私費を使ってデスクトップ、その当時600万ウォンのものを買って、今はないTheanoという言語で色々とコーディングして、このようにしていました。ディープラーニングを。

それでその時からそれなりにディープラーニングを少し早く接した世代として見ることができるのですが、そのようなことを10年近く見守っているので、まだ私は始まりだと思います。つまりAIでできる何かバリューがまだまで非常に無限だと思いますし、もっと発現されることが多いと思うんです。

その話は予備創業者や開発者の方に機会が非常に多いということです。それで多くの方が挑戦されること。つまりグローバルであれ、創業であれ、あるいは各現在属した会社であれ、もう少し多くの価値を作り出すことができる仕事が十分多いので、そのようなことをもう少し積極的に探してみて作り出すなら、個人的に大きな達成感があるのではないでしょうか。

それでもう少し挑戦してみること。まだ機会があまりにも多いようです。私が過去10年よりもはるかに大きなものがまだもっと多く残っているようだというのが私の個人的な考えで、それをお勧めしたいです。

まだ始まりだ。まだ始まりのようです。

Solar Pro 2の世界初公開デモ

今回少し特別に新しい推論モデルを準備されたと聞いたのですが、チョコーディングポッドキャストで最初にデモを見せてくださると聞きました。それでデモを見ながら、どの部分が変わったか一緒に見るのが良いでしょう。

はい、私たちのSolar Pro 2で現在名称をして、現在内部プライベートリリースになっています。それで最初公開で、来週リリースなので、放送が出る時は既にできているでしょう。

私たちがモデルを作る時、最も特徴的に見ているのが、まず推論ができる、推論能力があるので、シンキングトークンを吐き出しながら考えて答弁するのができるのですが、以前はDeepSeek推論モデルとチャットバージョン、このようにすべて別にありました。しかしこれが合わさりました、ハイブリッドモードと言って。

ただモデルは一つですが、これを推論をすること機能をオンオフできるようにモデルが学習されています。私たちのモデルも実際モデルが一つです。ハイにすれば、シンキングトークンを吐き出しながら答弁をして、ローにすれば、ただそのシンキングなしにすぐそのまま答える、このようになります。

私が色々な実験をするために検索も付けました。それでクエリした時、OpenAIもそのように使えるじゃないですか。検索機能、最新機能をすれば、することができます。それでそれも私たちがそのプレイグラウンドで公開されれば、みんなが使ってみることができるので、検索まで付けました。

最もよくやるのが、ストロベリー、これをやるじゃないですか。新しいモデル無条件やってみます。これが今推論機能を消してみます。それでこれが答弁が何か合うこともあり、間違うこともあるのですが、間違いました。

これを、それでは推論機能をつけてやってみれば、それならシンキングが入ります。これが一つのモデルで今色々なシンキングをするのですが、これ合いましたね。strawberryでRが三つどこにあるか答弁しました。これがあって、その次に当然この検索を使って付けることもできるでしょう。

それで最近これをよく質問するので、これがそのウェブページがあるでしょう、ストロベリーのRについて。それなら答弁が少し変わるでしょう。検索をして、検索基盤で答弁するので、三つだと答弁しました。

それで検索基盤でも答弁できるそのような機能がプレイグラウンドに備わって、申し上げたいのは、消したりつけたりできる、このようになって、これを一度見せたかったし、それでは推論能力を主に見たいので、これよく入れてみるものの一つです。

朝早く出勤したが結局出勤できずにいる。何かおかしいじゃないですか。それならこれを一度直してみてと言った時、これを一度消して一度答えてみます。

これ何かよくできなかったんです。そうでしょう。まだ少し変ですよね。これが修正されたと言ったのですが、つけてやれば、ああ、朝早く出勤したが結局出勤できずにいる、このようになったじゃないですか。

それでこのようにその思考が入れば、確実に答弁品質が上がるのを私たちも多く見ています。それでデモを使ってみられる時、このように一度消したりつけたりして見れば、そのリーズニングが入った時このような変化があるんだなということを知ることができると思います。

AはBより先に到着して、BはCより遅く到着した。誰が最も先に到着したかといえば、実際わからないんです。AあるいはCです。この結果を見ると、しかし必ずAやCのうち一つを選んで話します。

それでおそらくこれシンキングを消せば、ああ、これは間違いました。シンキングをつければ、今答弁が非常によくやりましたね。そうですね。このような方式で推論が入ってくれたのですが、現在公開されたプレビューバージョンは韓国語推論能力がかなり良いです。それで韓国語で多くテストしてみればとても良いでしょう。

このようなことも難しい問題です。その扉にプッシュがこのように逆さま、鏡に反転されてあれば、この向こう側にプッシュが書いてあるんですよね。それならこれ押さなければならないか、引かなければならないか。引かなければならない。何かこのようなことも、推論が必要ですね。今もよく当てましたね、引かなければならない。なぜなら反対方向で、など。

LLMがよくできないもののうち一つが、その整列問題、ソーティングするのをよくできないと知っているんです。下に与えられたストリングですが、アルファベット、ハングル、数字、特殊記号順に整列してくださいと言えば、アルファベット、ハングル、数字、特殊記号、すべて合いました。

普通やってみれば、他のモデルはよくできない、シンキングがなければよくできない場合があります。比較的少し簡単な推論問題を入れましたが、私たちが色々なことを入れてみてテストしているのですが、悪くなく出たようなので、実際これが6月末に公開する予定でしたが、中間バージョンがそれでも悪くないようなので、少し先行的に早く公開すればいいと思って、推論モデルを一つ、今日先に見せました。

ああ、大韓民国でもこのような凄まじい性能のフロンティアモデルが続けて出てきているんですね。

私たちも始まりなので、多くの応援をしてくださって、多く使ってみてくだされば、ここですべてフィードバックが残るじゃないですか。私たちもそれを参照して色々なことをやってみることができると思います。

とても良く見ました。お忙しい中、また貴重な時間を割いてくださった李活石CTOに再度感謝申し上げます。

良い質問、感謝します。

コメント

タイトルとURLをコピーしました