「幻方量化」が大規模モデルを作るのは、研究、探求をするため

幻方※1做大模型是为了做研究,做探索

暗涌:幻方决定下场※2做大模型,一家量化基金※3为什么要做这样一件事?

暗涌:幻方量化※1は大規模モデルの作成に参入すると決めましたが、クオンツ・ファンドがなぜこのようなことをするのですか?

梁文锋:我们做大模型,其实跟量化和金融都没有直接关系。我们独建了一个名为深度求索的新公司来做这件事。幻方的主要班底里,很多人是做人工智能的。当时我们尝试了很多场景,最终切入了足够复杂的金融,而通用人工智能可能是下一个最难的事之一,所以对我们来说,这是一个怎么做的问题,而不是为什么做的问题。

梁文锋:私たちが大規模モデルを作るのは、実はクオンツや金融のどちらにも直接関係がありません。私たちは「深度求索(ディープシーク)」という新会社を独自に設立することで、大規模モデルを作りました。幻方の主要メンバーのうち、多くは人工知能(AI)を作っています。当時、私たちはとても多くのシナリオを試し、最終的に十分複雑な金融に切り込みましたが、AGI(汎用人工知能/Artificial General Intelligence)は次の最も難しいことのひとつかもしれません。ですから私たちにとって言うと、これは「どのようにやるか」の問題であり、「なぜやるか」の問題ではないのです。

※1幻方量化

[huàn fāng liàng huà]
中国杭州市の投資ファンドで、DeepSeekの親会社。(High-Flyer)

※2下场

[xià chǎng]
参入する・ゲームコミュニティなど特定の分野においては、“下场”には特殊な意味があり、ゲーム会社やゲームに特定の紛争や出来事に参入するかどうかを指す

※3量化基金

[liàng huà jī jīn]
数値モデルやコンピュータプログラムを使用して投資戦略を決定するファンドのこと。クオンツ・ファンド

暗涌:你们要自训一个大模型,还是某个垂直行业※4——比如金融相关的大模型?

暗涌:あなたがたは大規模モデルを自社でトレーニングするのですか?それとも、ある特定の業界、例えば金融関係の大規模モデルなどをトレーニングしますか?

※4垂直行业

[chuí zhí háng yè]
市場経済において、製品やサービスの特性或いは属性で分類した特定の業界

梁文锋:我们要做的是通用人工智能※5,也就是 AGI。语言大模型可能是通往 AGI 的必经之路,并且初步具备了 AGI 的特征,所以我们会从这里开始,后边也会有视觉等。

梁文锋:私たちがやろうとしているのは汎用人工知能、すなわちAGIです。大規模言語モデルはAGIに至るまでに避けて通ることはできず、初期段階でAGIの特徴を備えています。ですから私たちはそこからスタートし、後は視覚なども手がけていくかもしれません。

※5通用人工智能

[tōng yòng rén gōng zhì néng]
汎用人工知能、AGI

暗涌:因为大厂的入局,很多创业型公司都放弃了只做通用型大模型的大方向。

暗涌:大手が“ゲームに加わる”ことで、多くのスタートアップ企業は、「汎用的大規模モデルのみを作る」という戦略の方向性を放棄しました。

梁文锋:我们不会过早设计基于模型的一些应用,会专注在大模型上。

梁文锋:私たちはモデルに基づいたアプリケーションを早急に設計するのではなく、大規模モデルに専念します。

暗涌:很多人认为,创业公司在大厂形成共识后下场,已经不是一个好的时间点。

暗涌:多くの人は、大手企業で共通認識を形成したあとスタートアップ企業が参入することは、すでに良いタイミングではない、と考えています。

梁文锋:现在看起来,无论大厂,还是创业公司,都很难在短时间内建立起碾压对手的技术优势。因为有OpenAI 指路,又都基于公开论文和代码,最晚明年,大厂和创业公司都会把自己的大语言模型做出来。大厂和创业公司都各有机会。

梁文锋:現在は、大手企業であれスタートアップ企業であれ、短期間のうちにライバルに競争優位性を打ち立てることは大変難しいようにみえます。なぜなら、OpenAIが手引きし、それに、公開論文やcodeに基づいて、遅くても来年、大手もスタートアップ企業も自社の大規模言語モデルを作り出すことができるだろうからです。どちらにも各々チャンスがあります。

现有垂类场景不掌握在初创公司手上,这个阶段对初创公司不太友好。但因为这种场景说到底也是分散的、碎片化的小需求,所以它又是更适合灵活的创业型组织的。

既存の特定分野においても、スタートアップ企業の手に負えないでしょう。しかし、このような状況もつまるところ分散され、断片化した小さなニーズです。ですからそれは、フレキシブルなスタートアップ企業型組織にこそ更に適しているのです。

从长期看,大模型应用门槛会越来越低,初创公司在未来 20 年任何时候下场,也都有机会。我们的目标也很明确,就是不做垂类和应用,而是做研究,做探索。

長期的に見ると、汎用大規模モデルの運用ハードルはますます低くなり、今後20年の間で、スタートアップ企業がいつ参入しても、皆にチャンスがあります。私たちの目標ははっきりしています、つまり特定分野の専用モデルやアプリケーションを作らず、研究、探求をすることです。

暗涌:为什么你的定义是‘做研究、做探索’?

暗涌:なぜあなたは「研究・探究する」が定義なのですか?

梁文锋:一种好奇心驱动。从远处说,我们想去验证一些猜想。比如我们理解人类智能本质可能就是语言,人的思维可能就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。从近处说,GPT4 还有很多待解之谜。我们去复刻的同时,也会做研究揭秘。

梁文锋:一種の好奇心に駆られて、です。広く言えば、私たちはいくつかの推測を検証したいのです。たとえば、人類の知能の本質は言語であり、人の思考はひとつの言語のプロセスである可能性がある、と私たちは理解しています。あなたは自分が思考しているつもりでも、実はあなたの脳内で言語を編み込んでいるのかもしれません。これは、大規模言語モデル上に人類に似た人工知能(AGI)が誕生するかもしれない、ということを意味します。具体的には、GPT4にはまだ多くの解き明かされていない謎があります。私たちはそれを模倣すると同時に、研究で謎を解き明かしていきたいのです。

暗涌:但研究意味着要付出更大的成本。

しかし、研究をすることは更に大きなコストが必要になることを意味します。

梁文锋:只做复刻的话,可以在公开论文或开源代码基础上,只需训练很少次数,甚至只需 finetune(微调)一下,成本很低。而做研究,要做各种实验和对比,需要更多算力,对人员要求也更高,所以成本更高。

ただ模倣するだけなら、公開論文やオープンソースのコードをベースに、わずかなトレーニングだけ、ひいては微調整(finetuning)をするだけでよく、コストは大変低いです。しかし研究には、さまざまな実験や比較をしなくてはならず、より多くの計算リソースが必要となり、スタッフへの要求も高くなります、そのためコストが更に高くなります。

暗涌:那研究经费哪里来?

その研究費はどこから来るのですか?

梁文锋:幻方作为我们的出资人之一,有充足的研发预算,另外每年有几个亿的捐款预算,之前都是给公益机构,如果需要,也可以做些调整。

梁文锋:幻方は私たちの出資者のひとつとして、十分な研究開発予算を擁しています。また、毎年数億元の寄付予算があります。これまではすべて公益団体にいっていましたが、必要があれば、調整することもできます。

暗涌:但做基础层大模型,没有两三亿美元,连牌桌都上不了※6,我们如何支撑它的持续投入?

暗涌:しかし、基礎からの大規模モデル(新しいモデル構造)を作るには、2~3億米ドルなければ市場競争に参入することすら出来ません。我々はどうやって継続的な投資を支えていくのですか?

※6上牌桌

[shàng pái zhuō]
市場競争に参入する、市場に参入する

梁文锋:我们也在找不同出资方在谈。接触下来,感觉很多 VC 对做研究有顾虑,他们有退出需求,希望尽快做出产品商业化,而按照我们优先做研究的思路,很难从 VC 那里获得融资。但我们有算力和一个工程师团队,相当于有了一半筹码※7

梁文锋:私たちも、さまざまな出資者を探して話を進めています。接触してみて、多くのVC(ベンチャーキャピタル)は研究に対し懸念があるように感じます。彼らはコラボレーションから離脱する衝動があって、できるだけ早く商業化する製品を作り出すことを望んでいます。しかし私たちの「まず研究する」という思考に当てはめると、VCから融資を獲得することは難しいです。しかし、私たちには計算リソースやエンジニアチームがあり、「半分のチップ」(強み)を持っているようなものです。

※7筹码

[chóu mǎ]
リソース、強み

暗涌:我们对商业模式做了哪些推演和设想?

暗涌:我々はビジネスモデルに対しどのような推論や想定をしていますか?

梁文锋:我们现在想的是,后边可以把我们的训练结果大部分公开共享,这样可以跟商业化有所结合。我们希望更多人,哪怕一个小 app 都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断。

梁文锋:私たちが現在考えているのは、後に私たちのトレーニング結果の大部分を公開してシェアすることです。そうすることで商業化と結びつけることができます。私たちの希望は、より多くの人がたとえ小さなアプリケーションでも低コストで大規模モデルを使うことができることであり、技術が一部の人や企業だけのものになり、独占されることがないことを望んでいます。

暗涌:一些大厂后期也会有一些服务提供,你们差异化的部分是什么?

暗涌:一部の大手も後にサービスを提供すると思いますが、あなた方はどんな差別化を図りますか?

梁文锋:大厂的模型,可能会和他们的平台或生态捆绑,而我们是完全自由的。

梁文锋:大手のモデルは、彼らのプラットフォームや周囲環境に縛られる可能性がありますが、私たちは完全に自由です。

暗涌:无论如何,一个商业公司去做一种无限投入的研究性探索,都有些疯狂。

暗涌:いずれにせよ、商業企業が研究や探究に無限に投資することは、いささかクレージーです。

梁文锋:如果一定要找一个商业上的理由,它可能是找不到的,因为划不来。从商业角度来讲,基础研究就是投入回报比※9很低的。OpenAI 早期投资人※8投钱时,想的一定不是我要拿回多少回报,而是真的想做这个事。我们现在比较确定的是,既然我们想做这个事,又有这个能力,这个时间点上,我们就是最合适人选之一。

梁文锋:もし絶対にビジネス上の理由を探すとしたら、探し出せないかもしれません。なぜなら割に合わないからです。ビジネス的な角度から言うと、基礎研究は投資利益率がとても低いのです。OpenAIの初期投資者が資金を投入した時に考えたことは、どれだけ報酬を得るかではなく、本当にそれがやりたい、ということでした。私たちが今確信していることは、私たちがそれをやりたくて、その能力があるからには、現時点で私たちこそ最もふさわしい人選でもある、ということです。

※8投钱

[tóu qián]
あるプロジェクトに資金を投入すること

※9投入回报比

[tóu rù huí bào bǐ]
(Return On Investment,ROI)投資に応じてリターンする価値、すなわち企業がプロジェクトを通して得られる経済的リターン、投資利益率


ページトップへ