September 11, 2021

機械学習におけるデータの重要性 – AI競争で勝つには、良質かつ膨大な学習データが必要

在、AI(人工知能)は健康、農業、金融、交通などの分野で利用され、その進歩を加速させています。しかし、ある特定の地区や地域を超えてAIを発展させるためには、良質かつ膨大なデータソースが必要です。データの利用促進はは、AIによる分析精度を向上させるための鍵であり、製品やサービスはパターン認識やインサイト生成からより高度な予測技術へと移行し、ひいてはより良い意思決定を実現します。

本企業がこのAI競争に参加して、最新の技術トレンドを捉えてリードするためには、巨大なデータウェアハウスを構築する必要があります。例えば、FPT、Viettel、VinAI、VNGといったベトナムを代表するテクノロジー企業は、将来のトレンドにアプローチするために、データウェアハウスを構築しています。私たちリッケイソフトもまたベトナムのテクノロジーリーダーの一員として、『Speech to Text』製品用の巨大な音声データウェアハウスを構築し、AI開発競争に参加しています。AI開発におけるデータの役割を多角的に理解していただくために、株式会社Rikkei AI 副社長 グエン・ミン・タン氏にインタビューしました。

AIは1950年代に考案されました。今日までの60年を超えるAI研究の歴史の中で、3回のブームがあったと言われています。第2次ブームまでは「ルールベース」と呼ばれる、人間が予めルールや知識を用意して、それらに基いて機械が判断するシステムが中心でした。

在は第3次ブームを迎え、機械が自らデータから知識を得る技術「機械学習」が中心となっています。特に、機械学習技術の先端領域である「深層学習(ディープラーニング)」がAI技術の中の鍵となっています。この深層学習の進歩によって、より多くの人が高度な技術にアクセスできるようになった結果、AIが広く認知され、実際に使われるようになりました。

Q4 Mesa De Trabajo 1

て、データについてのお話ですが、データは石油ではなく、21世紀の新たなブラックゴールドの源泉であると主張する意見が多くありました。AI製品はさまざまな要素技術の融合であり、データは不可欠な構成要素の一つです。統計によると、80%のAI製品の開発時間は、データ関連の処理に費やされています。AIの育成は、子供の教育に似ています。正しいデータを使って学習させれば、AIはうまく学習することができます。反対に、間違ったデータで教えれば、間違った学習をしてしまいます。不正確なタイミングで異質なデータが使われると、AIは混乱してしまいます。多くのAI向けデータを適切に活用して学習すれば、AIはより賢くなり、より正確に認識できるようになります。

GoogleやMicrosoftなどの大手テクノロジー企業や、自動運転車の開発に取り組むトヨタ、テスラ、ヒュンダイなどの自動車メーカーが、競争で優位に立つためにAI向けデータに多額の投資をしていることは間違いありません。例えば、Googleの音声認識エンジンの学習には、何十万時間の音声データが使われています。同様に、テスラは数百万枚の実写写真を使って自動運転車の学習を行っています。

ータラベリングに特化した企業も、AIのトレンドに追随しています。また、より迅速で正確なAIデータラベリング技術も開発されています。その結果、これらのビジネスのスタートアップ企業の多くがユニコーン企業へと成長しています。

Q3 Mesa De Trabajo 1

存知のとおり、リッケイソフトの『Speech To Text』とそのコアテクノロジーは、国会やいくつかの省庁、機関、その他の政府機関に導入されているAI音声認識ソリューションです。AI音声認識技術には幅広い用途がありますが、ベトナムでそれを活用している企業はごくわずかです。Viettel、FPT、VNG、VinGroupなどの大手企業はいずれも重要なプレーヤーです。

Sao Khue 2021

Q5 Mesa De Trabajo 1

は、なぜこのAI競争に参加する企業がまだそれほど少ないのでしょうか。それは、施設や設備インフラ、AI開発者などのリソースに加えて、この技術を活用には大量の音声データが必要になるためです。この音声データを収集し、分類するには多額の投資が必要になります。

たがって、すべての企業が経済的なリスクを許容できるわけではありません。特に、AI技術の習得や製品のアウトプットの実現可能性が不確かな場合にはそうです。

確なデータ収集と品質管理の難しさ、そしてAIデータのラベル付けにかかるコストは、世界中のどこにおいてもデータを作成する上で最も悩ましい課題と言えます。

ッケイソフトでは、『Speech-To-Text』を開発する時、現実にマッチした音声データソースの発見、内容の多様性、地理的条件、年齢、性別などに苦労しました。一人ひとりの聞き取りや理解能力が異なる場合、データのラベル付けは難しいかもしれません。 特にこの地域の人々は、他の人が話している音声を聞き取り、適切に捉えることが難しいと感じています。

ッケイソフトは、内部データラベリングと新しいサービス開発のニーズを満たすために、プロフェッショナル用のデータラベリングツール『Rikano』を研究開発しました。Rikanoは、世界中の他の多くのラベリングツールの利用法や特徴を参考にして作られました。

Rikanoによって、最も多いデータタイプである画像、音声、テキストなどデータのラベルを付けを容易する同時に、ユーザーが各プロジェクト参加者の進捗状況や作業品質、生産性、作業履歴なども簡単に管理できるようになりました。その結果、Rikanoはリッケイソフトのデータラベリングサービスの開発戦略において重要な役割を果たしています。

Q6 Mesa De Trabajo 1

業は、AIがもたらす可能性のあるメリットをより深く理解し、AIへの関心を高めています。その結果、ビジネスの活動に関連するすべてのデータが復元され、AI構築によるオペレーションの最適化を支援することになります。

う一つのAIのトレンドがAIデータのラベリングを防ぐためのアルゴリズムを作成することです。これは感情的な要素や人間的な要因によってコントロールされる可能性が高い労働集約的な作業です。ただし、これは将来の課題です。

More From ブログ

June 9, 2023

Mendixとローコードプラットフォームの力 • アプリケーション開発の未来

Mendix は、モバイルおよびWebアプリケーションを大規模に作成、デプロイ、保守、改善することができるオールインワンのローコードプラットフォームです。 アイデア出しからデプロイメント、メンテナンスの段階まで、アプリケーションの配信プロセスを迅速に進めることができるよう、企業をサポートするように設計されています。 また、クラウドネイティブソリューションとして、作成したアプリケーションをオンプレミスやあらゆるクラウド上に簡単に展開することが可能です。

May 24, 2023

Salesforceを活用したデータガバナンスとは?適切なデータガバナンスでデータを管理する

データ管理とガバナンスの重要性は増している ビジネスの拡大やグローバル化が進むにつれて、顧客情報の一元化やデータの保護、管理の重要性はさらに増しています。そのため多くの企業ではSalesforceなどのツールを導入していますが、拡張機能などをいまいち活用しきれていないこともあるのではないでしょうか。また、データの管理や処理、保護はルールやプロセスのもとで適切に行われる必要があるものの、それらを確実に実行するには莫大なリソースと時間がかかります。 そこでこの記事では、Salesforceを最大限活用しながら、データを正確かつ安全、確実なものにするデータガバナンスについてご紹介します。 Salesforceを活用したデータガバナンスとは データガバナンスは、データの正確性や信頼性、完全性、可用性など、データの管理や運用、セキュリティ担保に必要な手順やルールのことを指します。そのプロセスの中にはアクセス制御、バックアップや復旧、標準化なども含まれます。 データガバナンスのメリットとしては、以下の点が挙げられます。 ・データ品質の向上:データガバナンスを導入することで、データの信頼性や正確性を高めることができます。 ・リスクの軽減:データガバナンスがセキュリティやプライバシーに関するリスク軽減の対策そのものになるのはもちろん、データの機密性や整合性を維持することで、企業にとってのリスクを軽減できます。 ・責任の明確化:ルールがあることでデータの所有者や管理者、責任の所在を明確化できます。これにより、データ関連の問題が発生した場合にも「どの時点で、何の責任が発生しているか」をたどることができます。 ・意思決定の改善:データガバナンスによりデータ整理や分類の方法が統一化できることは、意思決定の改善につながります。データの信頼性や整合性が高くなるため、正確な情報に基づいた意思決定が可能となります。 ・コンプライアンスの確保:法律や規制に準拠することが求められる中、データガバナンスはコンプライアンスを確保するためのツールにもなります。企業はデータ保護法や規制に準拠する必要がありますが、データガバナンスの導入によりコンプライアンスの確保がしやすくなります。 データガバナンスのメリットがわかったところで、今度はガバナンスの策定と、Salesforceを活用しながら管理や処理を実行する際の手順、ポイントをいくつかご紹介します。 1. 課題を特定し、ガバナンスを策定する まずはデータを管理する前に必要なルールを策定しましょう。データの属人化やインシデントを防ぎ適切な管理を行うには、組織にある潜在的なリスクを特定した上で運用ルールを決める必要があります。 ちなみに、データガバナンスがルールを指すのに対してデータスチュワードとは「データという財産を適切に管理する人」のことを指します。データスチュワードが不在の場合は、その役割と責任範囲を正しく理解したうえで適切な人材を任命しましょう。 2. データ品質を管理する Salesforceによると、「世界中のマーケティング担当者の約5人中4人が、マーケティング主導の企業成長と顧客体験を実現するための鍵は、データ品質にあると回答しています」*としています。 このことからも、データ品質の管理はセキュリティ担保とマーケティングの両方から重要性を増しています。データ品質の管理には、重複レコードの管理やデータ整合性のチェック、不正データの削除などの定期的な実施が欠かせません。Salesforceでは、データの分類管理を柔軟な整合ロジックに基づいて自動化できます。これにより、空いた時間はインサイトに充てるなどビジネスの効率化が図れます。 3. データアクセスを制御する Salesforceではフィールドレベルのセキュリティ、IPアドレスに基づく制御など、役割に基づいてデータのアクセスが制御できます。適切なユーザーのみが信頼できるデータにアクセスできるように権限を管理する、不正なアクセスを防ぐなど、業界水準に準拠したシステムでデータの機密性とセキュリティを確保しましょう。役割に沿ったアクセス権を付与することは、データスチュワードやマーケティングリーダーが活用するデータの信頼性向上にもつながります。 4. データのバックアップと復旧 大規模災害やインシデントに備え、データのバックアップと復旧を実行することも重要です。Salesforceではプラットフォームの各層にセキュリティが備えられています。またバックアップ方法が複数提供されているため、システム障害やデータの損失に備え、復旧プランを定期的に確認、更新することができます。ネットワークサービスではデータの暗号化と転送機能、高度な脅威検出機能を、 アプリケーションサービスではアイデンティティ管理や認証機能も実装されています。 Salesforce Shieldを通じてさらに信頼性を強化することも可能です。これらのサービスを活用することで、データの可用性と完全性が確保できます。 5. データの標準化 Salesforceではデータの標準化を実行するために、暗号化やバリデーションルールの設定、フィールド値の選択肢の各種設定などが可能です。Shield Platform Encryptionでは取引先の住所や電話番号、商談内容といった標準項目から、フィード投稿やアンケート回答などのフィールド値までが暗号化できます。つまり、標準化によりデータはクリーンで使いやすく整合性が取れたものとなり、さらにセキュリティも向上させることができます。 まとめ テクノロジーが進歩し、顧客やユーザーのニーズも多様化する中、現代のビジネスをより安全に効率よく運営していく上でデータの正確性や信頼性は欠かせないものとなっています。しかし、ここまでご紹介したSalesforceの各種サービス、機能を活用することで、膨大なデータをより適切に管理、活用することが可能となります。組織が持つ課題を特定した上でガバナンスを構築し、Salesforceの一元化されたデータ管理プログラムを最大限活用してビジネスの成果と価値向上に役立てましょう。

April 17, 2023

ローコード開発ツール・プラットフォームを選ぶポイントは?おすすめのツールを10種紹介

ローコード開発ツールは、部品を組み立てるようにしてアプリケーションを開発できるツールです。コーディングをあまり行わないので、専門家でなくてもアプリケーションを開発できます。そのため、エンジニア不足の解消や開発スピードの向上、現場のニーズのくみ上げにもつながります。

April 11, 2023

おすすめのノーコードツール10選―開発の目的別に特徴・機能を比較

ノーコード開発は、コーディングの知識や技術がなくてもシステムやサービスの開発が可能です。こういったノーコード開発をするとき、重要となるのが使用するノーコードツールの選び方です。用途ごとにおすすめのノーコードツールをご紹介します。

April 10, 2023

Lightning Platformとは?Sales Cloudとはどう使い分ければいいのか

Lightning Platformは、Salesforce上で動作するアプリケーションを開発できるローコード開発ツールです。開発したアプリケーションを実行、運用保守、管理するプラットフォームでもあります。ここでは、Lightning Platformの基本的知識について幅広く紹介します。

March 25, 2023

Salesforce Service Cloudとは?特徴や機能、Sales Cloud との違いなどを解説

Salesforce Service Cloudは、セールスフォース社が提供するSFA/CRMシステムです。セールスフォース社が数多く提供するシステムのなかでも、中核となる製品です。ここでは、Salesforce Service Cloud とは何か、その機能、導入の際のメリットや注意点など、基本的な知識を紹介します。