いよいよ「生成AI」が農業に!? 農研機構が社会実装した「農業特化型生成AI」は、普及指導員と農業生産者の負担軽減を実現するか
さまざまな課題をはらみつつも注目を集めている生成AIを、農研機構が日本で初めて農業に特化させ、社会実装するという。それは一体どのようなサービスで、何を目指して開発されたのだろう? 2024年10月18日に行われた記者発表会をまとめて、お伝えしていこう。
本題に入る前に、AIと生成AIについて復習しておこう。
AIとは「Artificial Intelligence」の頭文字で人工知能のこと。人間が学習させることで、事前に決めておいた事柄を判断して自動的に行うことができる。AIは既に製品・サービスに搭載されており、農業を含めて社会に広く普及しつつある。
これに対して「生成AI」とは「Generative AI」のこと。「Generative」は日本語にすると「生成する力のある」。だから生成AIとは、生み出す力のあるAIのことだ。
機械学習、特にディープラーニングにより大量のデータからそれらの傾向や関係性を学習し、それらを基に新しいコンテンツを生成できる。誰しも一度は触れたことがあるであろう「ChatGPT」や「Gemini」はそのなかでもテキストを生成する生成AIだ。
農業従事者の高齢化と減少が同時進行している現状については、もはや説明不要だろう。基幹的農業従事者は今後20年間で2023年の116万人から30万人まで激減してしまう、という衝撃的な予測がある。
農業生産者に技術・経営等を指導する普及指導員は、地方行財政改革の影響などを受けて減り続けていたが、近年ようやく下げ止まった状況にある。しかし、こちらも人手不足であると言ってよい。新しい品種やスマート農業技術が次々と登場しており、普及組織に求められる知識はより深化、拡大している。
こうした状況下にある農業生産者と普及指導員の労働力減少への対策として、
今回社会実装された農研機構が開発した農業特化型生成AIは、「普及指導員が農業生産者に対して行う技術指導を効率化するツール」として開発された。すでに2024年10月21日より三重県にて、イチゴを対象にした生成AIの試験運用が開始されている。
具体的には、生成AIをチャットツールと組み合わせて三重県の野菜担当(イチゴは野菜である)の普及指導員に提供。イチゴ生産者からの質問に、普及指導員は農業特化型生成AIで情報を収集して回答する、というものだ。
これにより直接的には、普及指導員の負担を軽減できる。普及指導員は質問を受けた際、確信が持てなければ回答を保留して、事務所に帰って調べた結果を農業生産者に戻している。調べる時間は指導準備と呼ばれる普及活動時間に含まれるが、指導準備は普及指導業務時間の4割にも達するという報告がある。農業特化型生成AIを利用することで、この負担削減が実現する。
質問する側の新規就農者と既存農業生産者は、素早く正確かつ具体的な回答を得ることができるから、指導された内容を速やかに栽培に反映させることができる。これは効率向上のみならず、収量にも良い影響を与えるはずだ。
農研機構は今後この農業特化型生成AIの他作目への展開を目指す。普及指導員のオフィス等での調査時間を3割削減し、浮いた時間を使ってより高度な普及指導を可能とすることを目指すという。また全国の産地と協力して農業データのさらなる収集を進め、農業特化型生成AIのさらなる開発を進めるという。
さらに、開発している農業特化型生成AIのAPIは今後、農業データ連携基盤WAGRIに搭載されるという。APIとは「Application Programming Interface」の頭文字であり、ソフトウェアやWebサービス、アプリ等をつなぐインターフェースのこと。WAGRI利用会員にはチャットアプリ等を提供している企業もあるので、それら企業が生成AIのAPIを自社アプリに組み込み、農業生産者等が利用できる生成AIを搭載したサービスを提供する可能性がある。
ここからは、今回の農業特化型生成AI開発に関して、興味深いポイントを2つ紹介したい。
一つ目は、この農業特化型生成AIが、すでに農業生産者が利用しているチャットツール「FarmChat」に搭載された、という点だ。
「FarmChat」とは、株式会社ソフトビルが開発したチャット機能・配信機能を備えたコミニュケーションアプリ内に、検索機能や調査機能、データ連携機能を搭載したアプリのこと。個人登録は無料だが、それでいて市況情報や気象情報を取得できるほか、農薬検索や農薬の在庫記録を登録できる。生産団体や部会で加入する場合はグループ登録となり一部有料となるが、個人登録で使える機能に加えて、作付調査、収量調査、予定共有などができる。
今回のような生成AIがWAGRIにAPI搭載されれば、類似したサービスが登場して、日本の農業生産現場に生成AI活用が普及する可能性がある。
二つ目は、この生成AIは作物・地域に特化して構築されている、という点だ。
生成AIの学習データ量は、通常、「トークン」と呼ばれる言語処理の基本単位で計測される。トークンは単語や記号、あるいはそれらの一部分で構成され、AIモデルが効率的に処理できる形式として広く採用されている。
今回ベースとして用いられた規模の汎用生成AIの場合、事前学習として、1~2兆トークンにものぼるデータを学習していると言われる。ここから手始めに農業に関する一般知識についての1,000万トークンのデータを学習させた。さらに、地域・作目に特化した知識として、三重県のイチゴ栽培に関するデータを学習させて三重県のイチゴ栽培専門のローカルモデルを完成させた。
この後、指導員らしい答え方ができるようファインチューニングや、「RAG」(大規模言語モデルによるテキスト生成に、外部情報の検索を組み合わせることで、回答精度を向上させる技術)、「MoA」(複数の大規模言語モデルを組み合わせて、より高性能なAIシステムを作り出す新しい技術)を適用した。
この「RAG」と「MoA」の採用や汎用モデル→全国モデル→ローカルモデルという進化は、北海道大学大学院情報科学研究院の坂地泰紀准教授との共同開発のなかで生まれたものだ。
こうした手順を踏んだことで、この農業特化型生成AIは、一般的な生成AIを農業利用しようとすると必ず直面する問題を低減した。
それは、一般的な生成AIは、忌憚なく言えば、平気で嘘をつくということ。また、専門的な質問に対して、抽象的な回答しかできない場合があることだ。これらを克服するための手法が、上記のローカルモデル化とRAGの利用なのだ。
農研機構基盤技術研究本部農業情報研究センターデータ研究推進室上級研究員の桂樹哲雄さんが教えてくれた。
「インターネット上に公開されていない情報が、重要な鍵となります。情報の量は重要ではありますが、今回私たちは情報の量より質を重視した、ということです」
実際に、三重県は県産イチゴ栽培技術の集大成とも言える指導書や、県品種「かおり野」の栽培ポイントをまとめた資料などのデータを有している。今回、これらを学習させたという。今後、他品目・他地域に向けた生成AIを開発するには、三重県がイチゴで提供したものと同等のデータが求められることになる。
桂樹さんは、特定の作目・地方に最適化した農業特化型生成AIを一つ社会実装したことに胸を張りながらも、まだ課題は少なくない、という。
「三重県のイチゴについては、従前からの関係もあり、快くデータの提供を受けることができましたが、それが他作目・他地方自治体で速やかに可能かといえば、そうとも言えません。全都道府県の本庁や各地の公設試験場だけでなく、農業法人などにも声を掛け、データ提供を依頼しながら一軒一軒回っているところですが、それでも、なかなかすんなりとデータを頂けるというふうにはいきません。
ご提供いただくデータとそれを用いて構築した生成AIは、他の団体が利用できないようにしていますが、将来的には他の団体とも共有できるようになるといいなと思っています。
一方で、これらのデータは、その地方自治体等が長い時間と少なくないお金をかけて収集・構築したものですから、それを産地としてライバルになる他の地方自治体に使ってほしくない、という気持ちも理解できます。今後も、権利や公開範囲に配慮しながら、開発と社会実装を続けていきたいと考えています」
(研究成果) 国内初の農業特化型生成AIを開発|農研機構
https://www.naro.go.jp/publicity_report/press/laboratory/rcait/166108.html
「AI」と「生成AI」はどう違う? 生成AIはコンテンツを生成する
本題に入る前に、AIと生成AIについて復習しておこう。
AIとは「Artificial Intelligence」の頭文字で人工知能のこと。人間が学習させることで、事前に決めておいた事柄を判断して自動的に行うことができる。AIは既に製品・サービスに搭載されており、農業を含めて社会に広く普及しつつある。
これに対して「生成AI」とは「Generative AI」のこと。「Generative」は日本語にすると「生成する力のある」。だから生成AIとは、生み出す力のあるAIのことだ。
機械学習、特にディープラーニングにより大量のデータからそれらの傾向や関係性を学習し、それらを基に新しいコンテンツを生成できる。誰しも一度は触れたことがあるであろう「ChatGPT」や「Gemini」はそのなかでもテキストを生成する生成AIだ。
「農業特化型生成AI」社会実装第1号は、三重県のイチゴが対象
農業従事者の高齢化と減少が同時進行している現状については、もはや説明不要だろう。基幹的農業従事者は今後20年間で2023年の116万人から30万人まで激減してしまう、という衝撃的な予測がある。
農業生産者に技術・経営等を指導する普及指導員は、地方行財政改革の影響などを受けて減り続けていたが、近年ようやく下げ止まった状況にある。しかし、こちらも人手不足であると言ってよい。新しい品種やスマート農業技術が次々と登場しており、普及組織に求められる知識はより深化、拡大している。
こうした状況下にある農業生産者と普及指導員の労働力減少への対策として、
- 新規就農者を早期育成するための知識習得
- 既存農業従事者への最新農業技術の提供
今回社会実装された農研機構が開発した農業特化型生成AIは、「普及指導員が農業生産者に対して行う技術指導を効率化するツール」として開発された。すでに2024年10月21日より三重県にて、イチゴを対象にした生成AIの試験運用が開始されている。
イチゴ「かおり野」の栽培ノウハウを生成AIで活用
具体的には、生成AIをチャットツールと組み合わせて三重県の野菜担当(イチゴは野菜である)の普及指導員に提供。イチゴ生産者からの質問に、普及指導員は農業特化型生成AIで情報を収集して回答する、というものだ。
これにより直接的には、普及指導員の負担を軽減できる。普及指導員は質問を受けた際、確信が持てなければ回答を保留して、事務所に帰って調べた結果を農業生産者に戻している。調べる時間は指導準備と呼ばれる普及活動時間に含まれるが、指導準備は普及指導業務時間の4割にも達するという報告がある。農業特化型生成AIを利用することで、この負担削減が実現する。
質問する側の新規就農者と既存農業生産者は、素早く正確かつ具体的な回答を得ることができるから、指導された内容を速やかに栽培に反映させることができる。これは効率向上のみならず、収量にも良い影響を与えるはずだ。
農研機構は今後この農業特化型生成AIの他作目への展開を目指す。普及指導員のオフィス等での調査時間を3割削減し、浮いた時間を使ってより高度な普及指導を可能とすることを目指すという。また全国の産地と協力して農業データのさらなる収集を進め、農業特化型生成AIのさらなる開発を進めるという。
さらに、開発している農業特化型生成AIのAPIは今後、農業データ連携基盤WAGRIに搭載されるという。APIとは「Application Programming Interface」の頭文字であり、ソフトウェアやWebサービス、アプリ等をつなぐインターフェースのこと。WAGRI利用会員にはチャットアプリ等を提供している企業もあるので、それら企業が生成AIのAPIを自社アプリに組み込み、農業生産者等が利用できる生成AIを搭載したサービスを提供する可能性がある。
農研機構が開発した農業特化型生成AI開発のポイント
ここからは、今回の農業特化型生成AI開発に関して、興味深いポイントを2つ紹介したい。
一つ目は、この農業特化型生成AIが、すでに農業生産者が利用しているチャットツール「FarmChat」に搭載された、という点だ。
「FarmChat」とは、株式会社ソフトビルが開発したチャット機能・配信機能を備えたコミニュケーションアプリ内に、検索機能や調査機能、データ連携機能を搭載したアプリのこと。個人登録は無料だが、それでいて市況情報や気象情報を取得できるほか、農薬検索や農薬の在庫記録を登録できる。生産団体や部会で加入する場合はグループ登録となり一部有料となるが、個人登録で使える機能に加えて、作付調査、収量調査、予定共有などができる。
今回のような生成AIがWAGRIにAPI搭載されれば、類似したサービスが登場して、日本の農業生産現場に生成AI活用が普及する可能性がある。
二つ目は、この生成AIは作物・地域に特化して構築されている、という点だ。
生成AIの学習データ量は、通常、「トークン」と呼ばれる言語処理の基本単位で計測される。トークンは単語や記号、あるいはそれらの一部分で構成され、AIモデルが効率的に処理できる形式として広く採用されている。
今回ベースとして用いられた規模の汎用生成AIの場合、事前学習として、1~2兆トークンにものぼるデータを学習していると言われる。ここから手始めに農業に関する一般知識についての1,000万トークンのデータを学習させた。さらに、地域・作目に特化した知識として、三重県のイチゴ栽培に関するデータを学習させて三重県のイチゴ栽培専門のローカルモデルを完成させた。
この後、指導員らしい答え方ができるようファインチューニングや、「RAG」(大規模言語モデルによるテキスト生成に、外部情報の検索を組み合わせることで、回答精度を向上させる技術)、「MoA」(複数の大規模言語モデルを組み合わせて、より高性能なAIシステムを作り出す新しい技術)を適用した。
この「RAG」と「MoA」の採用や汎用モデル→全国モデル→ローカルモデルという進化は、北海道大学大学院情報科学研究院の坂地泰紀准教授との共同開発のなかで生まれたものだ。
ネットにない栽培ノウハウこそ生成AIで生かせる
こうした手順を踏んだことで、この農業特化型生成AIは、一般的な生成AIを農業利用しようとすると必ず直面する問題を低減した。
それは、一般的な生成AIは、忌憚なく言えば、平気で嘘をつくということ。また、専門的な質問に対して、抽象的な回答しかできない場合があることだ。これらを克服するための手法が、上記のローカルモデル化とRAGの利用なのだ。
農研機構基盤技術研究本部農業情報研究センターデータ研究推進室上級研究員の桂樹哲雄さんが教えてくれた。
「インターネット上に公開されていない情報が、重要な鍵となります。情報の量は重要ではありますが、今回私たちは情報の量より質を重視した、ということです」
実際に、三重県は県産イチゴ栽培技術の集大成とも言える指導書や、県品種「かおり野」の栽培ポイントをまとめた資料などのデータを有している。今回、これらを学習させたという。今後、他品目・他地域に向けた生成AIを開発するには、三重県がイチゴで提供したものと同等のデータが求められることになる。
課題は生成AIの基となるデータ提供と秘匿性
桂樹さんは、特定の作目・地方に最適化した農業特化型生成AIを一つ社会実装したことに胸を張りながらも、まだ課題は少なくない、という。
「三重県のイチゴについては、従前からの関係もあり、快くデータの提供を受けることができましたが、それが他作目・他地方自治体で速やかに可能かといえば、そうとも言えません。全都道府県の本庁や各地の公設試験場だけでなく、農業法人などにも声を掛け、データ提供を依頼しながら一軒一軒回っているところですが、それでも、なかなかすんなりとデータを頂けるというふうにはいきません。
ご提供いただくデータとそれを用いて構築した生成AIは、他の団体が利用できないようにしていますが、将来的には他の団体とも共有できるようになるといいなと思っています。
一方で、これらのデータは、その地方自治体等が長い時間と少なくないお金をかけて収集・構築したものですから、それを産地としてライバルになる他の地方自治体に使ってほしくない、という気持ちも理解できます。今後も、権利や公開範囲に配慮しながら、開発と社会実装を続けていきたいと考えています」
(研究成果) 国内初の農業特化型生成AIを開発|農研機構
https://www.naro.go.jp/publicity_report/press/laboratory/rcait/166108.html
SHARE