HAL_DATA_techBlog

HALDATAの技術ブログです。

2025-01-01から1年間の記事一覧

Gemini 3が切り拓く「操作できるAI」時代 —— スクリーン理解力がもたらす次の進化

Googleが新たに発表した Gemini 3。 そのベンチマーク結果の中でも、特に注目を集めているのが「スクリーン理解」分野の性能です。 いくつかの技術メディアでは、Gemini 3がOCRや画面構成の理解、UI操作といったタスクで他のモデルを圧倒したと報じています…

AmazonとPerplexityの対立に見る「イノベーションのジレンマ」

2025年11月、GIGAZINEが報じた「AmazonがAIエージェントによるブラウジングを止めるようAIブラウザのPerplexityを法的に脅迫」という記事が話題になっています。 AmazonがAIブラウザ「Perplexity Comet」に対して、「AIエージェントによる自動ブラウジングが…

AIブラウザの可能性を検証してみた(Comet vs Atlas、TrendViewer連携)

HALDATA 代表のHALです。ここ数週間、いわゆる「AIブラウザ」を実務にどう組み込めるかを検証しています。特に Comet と Atlas の2製品を対象に、当社のSaaS「TrendViewer」の分析画面を見せながら、実務に耐える“AIエージェント”としてのポテンシャルを見極…

「おもてなし」の心を持つAIアシスタントの育て方:Vertex AI Memory Bankと共に

文責:ベトナムエンジニア/Taro はじめに:完璧なアシスタントは、お客様のことを決して忘れない 京都にある伝統的な旅館の常連客になったと想像してみてください。訪れるたびに、女将は笑顔であなたを迎え、好きなお茶の種類、苦手な食べ物、前回訪れたのが…

Eコマースアシスタントシステム – 従来のチャットボットからマルチエージェントアシスタントへ

文責/ベトナム エンジニア: Souta ネット通販サイトでは、AIチャットボットを実装する要望が高まってきています。しかし、現時点で多くのAIチャットボットは、「この機能がある商品を教えて」といった簡単な質問にしか対応できません。 例えば、「引用元のレ…

PhoenixでLangSmith課金を卒業した話

— 自社エージェント開発のトレースを“タダ”で可視化できる幸福 — 1. なんで乗り換えたの? LangSmith は便利だけど、月額+ボリューム課金がジワジワ効く。 トレースをまめに残すほどコストが跳ね上がり、 「ログ取りたいのに泣く泣くサンプリング率を下げる…

Difyの落とし穴:LLMノード無しでもGPT-4課金!? — 高額請求を防ぐためのチェックリスト

1. 背景 ―― “使ってないはずのGPT-4” から高額請求!? 先日、社内の OpenAI ダッシュボードを眺めていたところ、想定を大幅に上回る料金 が発生していることに気づきました。 「Dify のワークフローでは LLMノード を使っていないし、gpt-4 を指定した覚えも…

CursorとChatGPTを賢く使い分けて“プレミアムリクエスト破産”を防ぐ

HALDATA開発チームの生成AI活用ルール はじめに ― なぜルールが必要なのか? 社内チャットツール Cursor は、IDE 連携やコード補完といった “エンジニア向け特化” の機能が充実しており、プロジェクト後半の実装フェーズでは欠かせない存在です。しかし Curs…

議事録の出力方法(HALDATA流)

こんにちは、HALDATA代表のHALです。今回は、当社で実際に運用している「議事録の生成フロー」についてご紹介します。 SaaSを開発・運営している会社として、日々のミーティングの量も多く、関係者も多岐にわたるため、議事録の整備と共有は業務効率を大きく…

RLHFシステムによる感情分類モデルの学習データ自動生成

1. はじめに - レビューセンテンスの感情分析(ネガポジ)の課題 「あなたは感情分析の精度を今でも信じていますか?」 Eコマースプラットフォームの商品レビューは、製品改善とマーケティング戦略構築において欠かせない情報の宝庫です。しかし、これらのレ…

Context7 MCP- 継続的に更新されるライブラリを扱う際の、LLM や AI コードエディタの制限を克服する最適なソリューション

問題の紹介 ChatGPT、Claude、Copilot などの大規模言語モデル(LLM)は、開発において強力なツールとなっています。しかし、これらのモデルは一般に古いデータをもとに学習されているため、古くなった、あるいは不正確なコードやAPIを提案してしまうことが…

レビューデータの意味的クラスタリング:OpenAI Embedding + UMAP + HDBSCAN

こんにちはHALDATAのTNです。今回はレビューデータを使ったクラスタリングの記事を書きます。 はじめに商品やサービスに対するレビューは、ユーザーの本音が詰まった貴重なデータです。しかし、その量が多くなると、一つひとつ目を通すのはなかなか大変です…

AIエージェント開発の最前線:OpenAI Agents SDK と GCP Vertex AI ADK の比較

こんにちは。HALDATA代表のHAL hatanakaです。 当社では現在、セルフホスト型からエージェントベースまで幅広くAIアプリケーションを開発しており、現在は OpenAI Agents SDK を試しています。Agents SDKは“Agents”や“Handoffs”、“Guardrails”といったプリミ…

MCPとA2Aが示すSaaSモデルの崩壊と新秩序

――SaaSは「単体」から「群」へ進化する 1. はじめに 2025年4月以降、MCP(Model Context Protocol) と A2A(Agent 2 Agent) が次世代の“AIエージェント・スタック”を形作るコア・プロトコルとして急速に注目を集めています。両者の登場により、私たちは 「…

オリジナルAPIを利用したGPTsの作成

はじめに 近年、AI技術の発展と共に、GPTsを活用したシステムが注目を集めています。弊社では、自社で提供するREST APIをGPTsから呼び出すことで、より柔軟かつ高機能なサービス実現を試みました。 本記事では、GPTsに自前で用意したREST APIを使わせる方法…

SmolAgentsとLangGraphのツール呼び出し比較 ~違いと使い分け~

はじめに: AIエージェントの開発では、どのように外部ツールを呼び出すかが重要なポイントになります。本記事では、SmolAgentsとLangGraphという2つのフレームワークに焦点を当て、それぞれのツール呼び出し方法の違いを解説します。初心者にも分かりやすい…

トランスフォーマーベースの言語モデルの推論速度を13倍に加速:ミリ秒単位の最適化の軌跡

1. はじめに:なぜ推論速度が成功の鍵となるのか? 人工知能の時代、Transformer アーキテクチャに基づく先進的な言語モデルは、私たちが言語を処理・理解する方法を根本から変革しました。コンパクトなモデルから巨大なモデルに至るまで、これらのモデルは…

Smolagentsの「安定した出力形態」でReACTを止めない仕組み

CodeAgentの仕組み AIサービス開発中「LLMが生成する出力形式が安定しない」ことが問題となるケースが少なくありません。たとえば、JSON形式のデータが必要なのに、回答が途中で自然言語に変わったり、タグが欠けてパースに失敗したりすることがあります。こ…

Hugging FaceのSmolagentsを活用したAIエージェントの設計と活用例

smolagents LLMにウェブ検索やデータベース操作などのツールを使わせることで、複雑なタスクを自律的にこなすシステムが実現できます。本記事では、Hugging Face社のオープンソースライブラリSmolagentsを使ったAIエージェントの設計とユースケースを紹介し…

小売・流通におけるAI導入戦略:参入時期とビジネス変革の視点

小売・流通におけるAI導入戦略:参入時期とビジネス変革の視点 生成AI(Generative AI)ブームが起きて以来、小売・流通業界でもAI活用への期待が高まっています。特にOpenAIが新たに発表したブラウザ操作型のAIエージェント「Operator(オペレーター)」な…

Amazonを使った流通ブランド向けAEO(AnswerEngineOptimization)

Amazon AEO AEO(Answer Engine Optimization)という新潮流 最近、「AEO(Answer Engine Optimization)」というバズワードが出現してます。SEO(Search Engine Optimization)の次に注目される存在ですが、まだまだピンと来ない人も多いかもしれません。と…