メインコンテンツへスキップ

人工知能

2017


機械学習の革命:Octo.aiの誕生

2017年初頭の今、Octo.aiの目まぐるしい旅を振り返ると、私たちが成し遂げたことに誇りと興奮を感じます。2013年の謙虚な始まりから、現在の広く認知されたオープンソースプロジェクトに至るまで、Octo.aiは機械学習とアナリティクスの民主化の最前線にいました。

アイデアの起源 #

2013年、機械学習の分野は急速に進化していましたが、最先端の研究と開発者やビジネスのための実用的でアクセスしやすいツールの間には明らかなギャップがありました。技術愛好家と起業家として、私はこのギャップを埋める機会を見出しました。共同創設者たちと共に、より広い層にアドバンスドアナリティクスと機械学習を利用可能にするプラットフォームを構想しました。

この構想がAuroraの誕生につながり、Octo.aiはその主力製品として、ビジネスのデータ分析と予測モデリングのアプローチを革新する機械学習のためのアナリティクスハイパーバイザーとなりました。

Octo.aiの構築:愛の労作 #

Octo.aiの技術アーキテクトとして、私には製品を一から形作る特権がありました。私たちは早い段階で大胆な決断をしました:Octo.aiをApache 2.0ライセンスの下でオープンソースにすることです。この決定は、コミュニティ主導の開発の力への信念と、より広いテックエコシステムに貢献したいという私たちの願いに基づいていました。

開発中に焦点を当てた主な機能は以下の通りです:

2015


AAHIT:次の10億人のユーザーのためのモバイル検索を革新する

急速に進化するモバイルテクノロジーの世界で、次の17.5億人以上のユーザーのユニークなニーズに対応する新しいプレイヤーが登場しました。AAHIT(Advanced Artificial Human Intelligence Technology)は単なる検索エンジンではありません - 新興市場のユーザーが情報とどのように対話するかにおけるパラダイムシフトです。

AAHITのビジョン #

AAHITの核心的な使命はシンプルでありながら革命的です:すべてのスマートフォンで最もスマートな電話帳の連絡先になることです。WhatsAppの普及を活用することで、AAHITは従来の検索エンジンにアクセスできない、または使用が面倒だと感じるユーザーに洗練された検索機能をもたらします。

AAHITの仕組み #

AAHITの美しさはその単純さにあります:

内部構造:NomNomのNLPとRDFシステムの技術的実装

インテリジェントなレシピチャットボットであるNomNomの開発を続ける中で、その実装の背後にある技術的詳細の一部を共有できることを嬉しく思います。NomNomの核心部分では、高度な自然言語処理(NLP)技術とRDFベースの堅牢な知識グラフを組み合わせて、シームレスで会話型のレシピ検索体験を提供しています。

NLPパイプライン:ユーザー入力から構造化クエリへ #

私たちのNLPパイプラインは、ユーザーの自然言語クエリを、RDF知識グラフに対して問い合わせるために使用できる構造化された表現に変換するように設計されています。以下が主要コンポーネントの内訳です:

  1. トークン化:ユーザー入力を個々のトークンに分解するために、PythonのNatural Language Toolkit(NLTK)を使用しています。このステップは、さらなる処理のために重要です。

  2. 品詞タグ付け:クエリ内の各単語の文法的役割を識別するために、NLTKの品詞タガーを適用します。これはユーザーのリクエストの構造を理解するのに役立ちます。

  3. 固有表現認識(NER):Stanford NERと料理ドメインに特化した追加の訓練データを使用して、カスタムNERモデルを開発しました。これにより、ユーザーのクエリ内の材料、調理方法、料理、その他の関連エンティティを識別できます。

  4. 依存関係解析:複雑なリクエストに特に有用なクエリの異なる部分間の関係を理解するために、Stanford Parserを使用しています。

  5. 意図分類:ユーザークエリをレシピ検索、栄養照会、調理技術の説明などの意図に分類するために、scikit-learnを使用したマルチクラス分類モデルを実装しました。

  6. クエリ生成:抽出されたエンティティ、識別された意図、解析された構造に基づいて、RDF知識グラフに対して実行できるSPARQLクエリを生成します。

RDF知識グラフ:NomNomの頭脳 #

私たちのRDF知識グラフはApache Jenaフレームワークを使用して構築および管理されています。この重要なコンポーネントの構造と実装方法は以下の通りです:

NomNom:RDFとナレッジグラフによるレシピ検索の革命

人工知能と自然言語処理の急速に進化する世界で、私たちはNomNomを紹介できることを嬉しく思います。NomNomは、人々がレシピを検索し発見する方法を変革する最先端のチャットボットです。リソース記述フレームワーク(RDF)とナレッジグラフの力を活用することで、NomNomは料理探索に新しいレベルのインテリジェンスをもたらしています。

レシピデータにおけるRDFの力 #

NomNomの中核にあるのは、RDFを使用して構築された堅牢なナレッジグラフです。RDFに馴染みのない方のために説明すると、RDFはWebでのデータ交換のための標準モデルであり、レシピのような複雑で相互に関連したデータを表現するのに特に適しています。RDFがレシピデータにとってゲームチェンジャーである理由は以下の通りです:

  1. 柔軟なデータ表現:RDFを使用すると、レシピ、材料、調理方法、栄養情報を非常に柔軟で拡張可能な方法で表現できます。

  2. 意味的関係:RDFを使用すると、材料の代替品や調理方法のバリエーションなど、レシピの異なる要素間の意味的関係を簡単に確立し、クエリを実行できます。

  3. 相互運用性:RDFの標準化されたフォーマットにより、レシピデータを他のデータセットやシステムと簡単に統合できます。

  4. スケーラビリティ:レシピデータベースが成長するにつれて、RDFのグラフ構造により、大規模なデータセットの効率的なスケーリングとクエリが可能になります。

NomNomナレッジグラフの構築 #

私たちのナレッジグラフは、NomNomのインテリジェンスの背骨です。以下は、その構築方法です: