2025-01-01から1年間の記事一覧
Googleが新たに発表した Gemini 3。 そのベンチマーク結果の中でも、特に注目を集めているのが「スクリーン理解」分野の性能です。 いくつかの技術メディアでは、Gemini 3がOCRや画面構成の理解、UI操作といったタスクで他のモデルを圧倒したと報じています…
2025年11月、GIGAZINEが報じた「AmazonがAIエージェントによるブラウジングを止めるようAIブラウザのPerplexityを法的に脅迫」という記事が話題になっています。 AmazonがAIブラウザ「Perplexity Comet」に対して、「AIエージェントによる自動ブラウジングが…
HALDATA 代表のHALです。ここ数週間、いわゆる「AIブラウザ」を実務にどう組み込めるかを検証しています。特に Comet と Atlas の2製品を対象に、当社のSaaS「TrendViewer」の分析画面を見せながら、実務に耐える“AIエージェント”としてのポテンシャルを見極…
文責:ベトナムエンジニア/Taro はじめに:完璧なアシスタントは、お客様のことを決して忘れない 京都にある伝統的な旅館の常連客になったと想像してみてください。訪れるたびに、女将は笑顔であなたを迎え、好きなお茶の種類、苦手な食べ物、前回訪れたのが…
文責/ベトナム エンジニア: Souta ネット通販サイトでは、AIチャットボットを実装する要望が高まってきています。しかし、現時点で多くのAIチャットボットは、「この機能がある商品を教えて」といった簡単な質問にしか対応できません。 例えば、「引用元のレ…
— 自社エージェント開発のトレースを“タダ”で可視化できる幸福 — 1. なんで乗り換えたの? LangSmith は便利だけど、月額+ボリューム課金がジワジワ効く。 トレースをまめに残すほどコストが跳ね上がり、 「ログ取りたいのに泣く泣くサンプリング率を下げる…
1. 背景 ―― “使ってないはずのGPT-4” から高額請求!? 先日、社内の OpenAI ダッシュボードを眺めていたところ、想定を大幅に上回る料金 が発生していることに気づきました。 「Dify のワークフローでは LLMノード を使っていないし、gpt-4 を指定した覚えも…
HALDATA開発チームの生成AI活用ルール はじめに ― なぜルールが必要なのか? 社内チャットツール Cursor は、IDE 連携やコード補完といった “エンジニア向け特化” の機能が充実しており、プロジェクト後半の実装フェーズでは欠かせない存在です。しかし Curs…
こんにちは、HALDATA代表のHALです。今回は、当社で実際に運用している「議事録の生成フロー」についてご紹介します。 SaaSを開発・運営している会社として、日々のミーティングの量も多く、関係者も多岐にわたるため、議事録の整備と共有は業務効率を大きく…
1. はじめに - レビューセンテンスの感情分析(ネガポジ)の課題 「あなたは感情分析の精度を今でも信じていますか?」 Eコマースプラットフォームの商品レビューは、製品改善とマーケティング戦略構築において欠かせない情報の宝庫です。しかし、これらのレ…
問題の紹介 ChatGPT、Claude、Copilot などの大規模言語モデル(LLM)は、開発において強力なツールとなっています。しかし、これらのモデルは一般に古いデータをもとに学習されているため、古くなった、あるいは不正確なコードやAPIを提案してしまうことが…
こんにちはHALDATAのTNです。今回はレビューデータを使ったクラスタリングの記事を書きます。 はじめに商品やサービスに対するレビューは、ユーザーの本音が詰まった貴重なデータです。しかし、その量が多くなると、一つひとつ目を通すのはなかなか大変です…
こんにちは。HALDATA代表のHAL hatanakaです。 当社では現在、セルフホスト型からエージェントベースまで幅広くAIアプリケーションを開発しており、現在は OpenAI Agents SDK を試しています。Agents SDKは“Agents”や“Handoffs”、“Guardrails”といったプリミ…
――SaaSは「単体」から「群」へ進化する 1. はじめに 2025年4月以降、MCP(Model Context Protocol) と A2A(Agent 2 Agent) が次世代の“AIエージェント・スタック”を形作るコア・プロトコルとして急速に注目を集めています。両者の登場により、私たちは 「…
はじめに 近年、AI技術の発展と共に、GPTsを活用したシステムが注目を集めています。弊社では、自社で提供するREST APIをGPTsから呼び出すことで、より柔軟かつ高機能なサービス実現を試みました。 本記事では、GPTsに自前で用意したREST APIを使わせる方法…
はじめに: AIエージェントの開発では、どのように外部ツールを呼び出すかが重要なポイントになります。本記事では、SmolAgentsとLangGraphという2つのフレームワークに焦点を当て、それぞれのツール呼び出し方法の違いを解説します。初心者にも分かりやすい…
1. はじめに:なぜ推論速度が成功の鍵となるのか? 人工知能の時代、Transformer アーキテクチャに基づく先進的な言語モデルは、私たちが言語を処理・理解する方法を根本から変革しました。コンパクトなモデルから巨大なモデルに至るまで、これらのモデルは…
CodeAgentの仕組み AIサービス開発中「LLMが生成する出力形式が安定しない」ことが問題となるケースが少なくありません。たとえば、JSON形式のデータが必要なのに、回答が途中で自然言語に変わったり、タグが欠けてパースに失敗したりすることがあります。こ…
smolagents LLMにウェブ検索やデータベース操作などのツールを使わせることで、複雑なタスクを自律的にこなすシステムが実現できます。本記事では、Hugging Face社のオープンソースライブラリSmolagentsを使ったAIエージェントの設計とユースケースを紹介し…
小売・流通におけるAI導入戦略:参入時期とビジネス変革の視点 生成AI(Generative AI)ブームが起きて以来、小売・流通業界でもAI活用への期待が高まっています。特にOpenAIが新たに発表したブラウザ操作型のAIエージェント「Operator(オペレーター)」な…
Amazon AEO AEO(Answer Engine Optimization)という新潮流 最近、「AEO(Answer Engine Optimization)」というバズワードが出現してます。SEO(Search Engine Optimization)の次に注目される存在ですが、まだまだピンと来ない人も多いかもしれません。と…