Filter
Exclude
Time range
-
Near
AWSのAI/機械学習系マネージドサービスとその役割 Amazon Transcribe  音声→テキスト Amazon Comprehend  感情分析・自然言語分析 Amazon Polly  テキスト → 音声 Amazon Rekognition  画像・動画分析 Amazon Textract  OCR(文字認識) Pollyはオウムにつけるあだ名らしい。
9
You don't follow jesus. You vote to starve the poor and textract what little wealth the poor has and give it to the rich. That's the opposite of Jesus. You do not vote for the values of Jesus you vote to protect white christian power.
1
6
問い合わせ3割減|AWSエージェント実運用の設計 ai.whytrend.jp/articles/3c78… 米Rocket CloseがエージェントAI「Supercharger」を実運用し、コールセンターへの電話・メールを月数千件、入電を30%削減した。基盤はAWSのオープンソース開発キットStrands AgentsとAmazon Bedrock経由のAnthropic Claude。各データ源をAIと外部ツールをつなぐ共通規格(MCP)でツール化し、後からデータ源を足せる拡張設計を採った。 ■ なぜ今これが重要か ・技術面: Rocket Closeは各データ源を個別のツールとしてAIと外部ツールをつなぐ共通規格(MCP)で公開し、エージェントが質問に応じて動的に選ぶ構成を採った。データ源を後から1ツールずつ足せるため、社内システムが分断している企業でもパイプラインを作り直さずに対象範囲を広げられる。 ・市場面: 基盤はAWSのオープンソース開発キットStrands AgentsとAmazon Bedrock経由のAnthropic Claudeで、特定モデルへの作り込みを避けている。コールセンター入電30%減という実運用の業務効果が公式ブログで示され、PoC止まりではない適用先として権原審査のような州別ルールの横断調査が挙がった。 ・規制・社会面: 機密データ保護のため、Bedrockの安全機能Guardrailsと行単位のアクセス制御を組み合わせ、エージェントが参照すべきでない行へ到達しない設計を入れた。規制業種でエージェントを動かす際の権限境界の作り方の具体例になる。 ■ 要点 ・エージェントAI実運用でコールセンター入電を30%削減、月数千件の電話・メールを圧縮 ・基盤はAWSのオープンソース開発キットStrands Agents+Bedrock経由のClaude ・各データ源をMCPでツール化し、新データ源を後から足せる拡張設計 ・Bedrock Guardrailsと行単位アクセス制御で機密データへの誤アクセスを防止 ・州ごとに異なる権原審査という分断業務に自然言語で横断回答する実装事例 ■ 誰に効くか [追い風] ・AWSのエージェント開発スタック利用企業: Strands AgentsとBedrock、MCPの組み合わせで実運用に届いた事例が公式に出たことで、同じスタックを使う国内企業が設計の参照点を得る。 ・分断システムを抱える業務部門: 州別ルールや郡ごとの要件のように担当者が複数システムを横断していた調べ物を、自然言語の質問1本に集約できる。 ・規制業種でAI導入を進める実装担当: Guardrailsと行単位アクセス制御を組み合わせた権限境界の作り方が、監査や機密データ保護の要件に答える具体例として使える。 [逆風] ・問い合わせ対応を人海戦術に依存する運用: Rocket Closeでは月数千件の電話・メールが削減され、有人対応前提の体制はコスト構造の見直しを迫られる。 ■ 今やるべきこと ・技術判断者: 確認する: AWS公式ブログでStrands Agents・Bedrock・MCPの構成と、Guardrails・行単位アクセス制御による権限境界の作り方を ・事業判断者: 定義する: コールセンター入電のうちエージェントで代替できる問い合わせ種別と、削減目標を月件数で ・実装担当者: 試す: 自社の分断データ源を1つMCPツール化し、自然言語の質問に対する回答精度と誤アクセスの有無を ■ 時系列 ・過去: Rocket Closeが住宅ローン需要拡大に伴い、州別の権原審査と分断システム横断の調べ物がボトルネック化 ・過去: Rocket CloseがAmazon BedrockとAmazon Textractで住宅ローン書類処理を変革した事例を公表 ・2026年6月13日: AWSがエージェント型AI「Supercharger」によるコールセンター入電30%削減事例を公式ブログで公表 ■ 一次情報 ・公式発表 aws.amazon.com/blogs/machine… ・Strands Agents解説(AWS) aws.amazon.com/blogs/opensou… ・Model Context Protocol(MCP)解説 aws.amazon.com/blogs/machine… ・Rocket Closeの文書処理事例(関連) aws.amazon.com/blogs/machine… 全文・図解・関連記事は冒頭リンクの記事ページへ。
243
Extract text, tables, and forms from images and PDFs with Amazon Textract in Haystack. AmazonTextractConverter brings @awscloud's OCR capabilities directly into your document processing pipelines. Just pass an image or single-page PDF and ask natural-language questions to extract structured data automatically. 🐍 pip install amazon-textract-haystack 🔗 haystack.deepset.ai/integrat…
6
123
Replying to @SumitM_X
Building RAG over 10,000 mixed PDFs: 1. Extract intelligently: * Text → pdfplumber * Tables → Camelot (preserve as Markdown) * Charts → Vision LLM captions * Scanned documents → OCR/Textract 2. Chunk semantically (~512 tokens). Never split tables. Tag every chunk with metadata such as filename, page number, and content type. 3. Use hybrid retrieval: * Vector search BM25 * Cross-encoder reranker Don't skip the reranker. 4. Ground the LLM strictly in retrieved context: * Answer only from provided context * Cite document and page number * Evaluate with RAGAS Most RAG systems succeed or fail on two things: extraction quality and reranking.
14
457
I will agree on support falling off for their neglected services. Any time I interact with Textract/Comprehend support, they take 1 hrs to join the chat and my issue is always a bug they got to reach out to the product team for. I also agree senior engineers will be good at AI.
1
24
2/ The path: Photo → AWS Textract OCR → OpenAI structured extraction → fuzzy match vs a 5,000 SKU Elasticsearch catalog Each stage demoed beautifully in isolation.
15
Jun 10
textract日本語ダメならazureかGoogleためすかな それが先にAmazon Bedrockでやりたい事試すか
15
自分用AWSサービスメモ📝 Amazon RDS:構造化データを保存するリレーショナルデータベースサービス。SQLで問い合わせできるデータを扱う。 Amazon Redshift:大量の構造化データを保存・分析するデータウェアハウスサービス。機械学習用データの元データとして使われることがある。 Amazon S3:機械学習のトレーニングデータ、画像データ、モデルアーティファクトなどを保存するストレージサービス。 Amazon DynamoDB:JSONのような半構造化データを保存できるNoSQLデータベースサービス。 Amazon DocumentDB:ドキュメント形式の半構造化データを保存できるデータベースサービス。 Amazon Bedrock:基盤モデルや大規模言語モデルを使って、生成AIアプリケーションやAIエージェントを構築するAWSサービス。ナレッジベースを使ったRAGにも対応できる。 Amazon SageMaker:機械学習モデルの構築・トレーニング・デプロイを行うための機械学習サービス。データ準備、モデル学習、リアルタイム推論エンドポイントなどに使う。 Amazon SageMaker Ground Truth:教師あり学習で使うトレーニングデータにラベル付けするためのサービス。 Amazon Mechanical Turk:人間による作業をクラウドソーシングで依頼できるサービス。画像やデータのラベル付け作業で活用できる。 Amazon Rekognition:画像や動画を分析するコンピュータビジョン向けのAIサービス。顔認識、物体検出、不適切コンテンツの検出などに使う。 Amazon Textract:スキャンした文書や画像から、テキスト、手書き文字、フォーム、表データを抽出するAIサービス。 Amazon Comprehend:自然言語処理のAIサービス。文章からキーフレーズ、感情、PIIなどを検出できる。 Amazon Lex:音声やテキストを使ったチャットボットや自動音声応答システムを構築するサービス。 Amazon Transcribe:音声や動画の音声をテキストに変換する自動音声認識サービス。文字起こしや字幕作成に使える。 Amazon Polly:テキストを自然な音声に変換するサービス。記事の読み上げや音声案内に使える。 Amazon Kendra:機械学習を使ったエンタープライズ検索サービス。社内文書などから自然言語の質問に合う情報を探せる。 Amazon Personalize:ユーザーごとにパーソナライズされたレコメンデーションを作成するサービス。ECサイトのおすすめ商品などに使う。 Amazon Translate:テキストを多言語に翻訳する機械翻訳サービス。チャットのリアルタイム翻訳などに使える。 Amazon Forecast:過去の時系列データを使って将来の需要や売上などを予測するサービス。 Amazon Fraud Detector:オンライン決済詐欺や偽アカウント作成など、不正行為の可能性を検出するサービス。 AWS DeepRacer:強化学習を学ぶためのサービス。モデルレースカーを使って、エージェント・環境・報酬の考え方を学べる。 PartyRock:Amazon Bedrockを使って、生成AIアプリケーションを簡単に作成・体験できるAWSの学習用ツール。 #AWSサービスメモ
8
512
Jun 9
MarkItDown de Microsoft convierte archivos y documentos Office a Markdown. Pensado para meterle a LLMs, preserva estructura y contenido. Más ligero que textract y enfocado en mantener la jerarquía del documento intacta.
4
7
63
2,189
The fastest way to understand AWS is by building real-world architectures that combine compute, networking, storage, security, databases, containers, and automation. Here are 10 production-style AWS projects that will teach you the services companies actually use. 👇 Compute & Containers AWS Lambda Amazon EC2 Amazon ECS AWS Fargate Amazon EKS AWS App Runner AWS Batch Amazon Lightsail Lambda@Edge Networking & Content Delivery Amazon API Gateway Application Load Balancer (ALB) Amazon CloudFront AWS Cloud Map Amazon Route 53 Storage Amazon S3 Databases Amazon DynamoDB Amazon RDS Amazon ElastiCache Identity & Access Management AWS IAM Amazon Cognito Security AWS WAF Containers & Images Amazon ECR Messaging & Event-Driven Services Amazon SQS Amazon EventBridge AWS Step Functions Monitoring & Observability Amazon CloudWatch AI / Document Processing Amazon Textract
2
5
45
2,164
Why can’t I just throw this into gemini? Isn’t this just textract? Uhhhhhh, azure?? Dawg have you tried them???? Try throwing in aunt betty’s dirty, scanned, thousand row EOB and you’re in for a world of hurt. Legacy OCR, one-shot VLMs, etc are great at simple docs and one-off use cases, but shit the bed when you need granular control & outputs for your messy docs at scale. With our big launch of our latest Parse 2.0 model yesterday, we’re putting our money where our mouth is and challenge you (yes, YOU) to see if you can break it. If we lose out to the other providers, you get $500 in credits to crank thru in Extend. pretty simple! try it here: challenge.extend.ai

4
314
May 18
卒研、Textract使おうと思ったら、卒研で使うように指定されたリージョン対応してなかった、、🙄 交渉😌
10
541
今週のAWSハンズオン&ポートフォリオ作り記録: ✅ AWS Lambda × Amazon Textract (OCR) ✅ Visual Crossing API で気象データ取得 ✅ AWS Secrets Manager で認証情報管理 ✅ Python unittest & Mock で単体テスト ✅ Git Feature Branching & Release 管理 週末はNZ就活のための武器作り!
Replying to @uru_larav
とりあえず最新情報をもとに戦略を考えた感じだとクラウド/DevOpsで就職、実務経験作る、SMC or Green Listで半年から1.5年でRV(条件付き永住金)、その後2年でPV(永住権)が最短らしい。技術職にとっては追い風らしい。AWSとDevOpsのスキルが結構大事っぽい。GitHub強化ですね。
3
233
But it isn’t true in practice. Competent software engineers can automate the work of thousands of business people. This is no joke - there are tons of people doing jobs that simple machine learning solved years ago. ex: lots of people manually reading and keying in info from PDFs that AWS Textract does easily. The main test of whether a project should be funded is if it has a positive NPV. Every company has a practically limitless to-do list of positive NPV projects. The more value AI brings, the longer the list. AI will increase the need for employees for the foreseeable future.
1
4
424
If I had to master AWS, I’d learn these concepts: 1. Cloud Computing Basics 2. AWS Global Infrastructure 3. Regions & Availability Zones 4. IAM (Identity & Access Management) 5. AWS Organizations 6. Shared Responsibility Model 7. EC2 (Elastic Compute Cloud) 8. Auto Scaling 9. Elastic Load Balancer (ELB) 10. Route 53 11. VPC (Virtual Private Cloud) 12. Subnets 13. Internet Gateway 14. NAT Gateway 15. Security Groups 16. Network ACLs 17. VPN & Direct Connect 18. S3 (Simple Storage Service) 19. S3 Storage Classes 20. Lifecycle Policies 21. Glacier 22. EBS (Elastic Block Store) 23. EFS (Elastic File System) 24. FSx 25. CloudFront CDN 26. RDS (Relational Database Service) 27. Aurora 28. DynamoDB 29. ElastiCache 30. Redshift 31. Database Replication 32. Backup & Restore 33. Lambda Functions 34. Serverless Architecture 35. API Gateway 36. Step Functions 37. EventBridge 38. SQS (Simple Queue Service) 39. SNS (Simple Notification Service) 40. Kinesis 41. ECS (Elastic Container Service) 42. EKS (Elastic Kubernetes Service) 43. Docker on AWS 44. Fargate 45. CloudFormation 46. Infrastructure as Code (IaC) 47. AWS CDK 48. Elastic Beanstalk 49. CI/CD Pipelines 50. CodeCommit 51. CodeBuild 52. CodeDeploy 53. CodePipeline 54. CloudWatch 55. CloudTrail 56. AWS Config 57. X-Ray 58. Monitoring & Logging 59. Observability 60. WAF (Web Application Firewall) 61. Shield 62. GuardDuty 63. Inspector 64. Secrets Manager 65. KMS (Key Management Service) 66. Encryption 67. Cognito 68. Authentication & Authorization 69. AWS Backup 70. Disaster Recovery 71. High Availability 72. Fault Tolerance 73. Scalability 74. Elasticity 75. Cost Optimization 76. AWS Pricing Models 77. Reserved Instances 78. Spot Instances 79. Savings Plans 80. Trusted Advisor 81. Multi-Region Architecture 82. Multi-Account Strategy 83. Hybrid Cloud 84. Migration Strategies 85. AWS Migration Hub 86. DataSync 87. Storage Gateway 88. Machine Learning with AWS 89. SageMaker 90. AI Services 91. Rekognition 92. Textract 93. Comprehend 94. Bedrock 95. DevOps on AWS 96. Security Best Practices 97. Well-Architected Framework 98. SaaS Architecture on AWS (...and more concepts) === 👋 PS - Want a complete AWS roadmap from beginner to advanced? Read right now: → Grab the AWS Ebook: codewithdhanian.gumroad.com/… === 💾 Save this for later & RT to help others learn AWS. 👤 Follow @e_opore turn on notifications.
11
22
101
3,375
請求書処理、月26時間が4時間になった話。 結論から言うと、AI OCRの「信頼範囲」を絞っただけです。 全自動でもなく、全チェックでもない。 その中間を見つけた瞬間に、経理の時間が6分の1になりました。 半年ほど前、うちのチームで請求書処理を担当していたスタッフが1人抜けました。 採用が間に合わず、僕が1人で回すしかなくなった。 当時の処理フローはこうでした。 紙orPDFの請求書を開く、金額を手入力、振込先を照合、勘定科目を仕分け。 1枚あたり平均10〜12分かかっていた。 月の処理枚数は100枚を超えている。 単純計算で月20時間以上を請求書だけに使っていたことになります。 最初に試したのはGoogle Cloud Vision APIでした。 印刷文字の読み取りは悪くない。 ただ、手書きの金額欄が壊滅的で、「¥38,000」を「¥88,000」と誤読する。 精度は体感で80%前後。 これでは結局すべて目視確認が必要で、時短にならなかった。 2つ目に試したのはAmazon Textract。 テーブル抽出機能があって構造化データとしては優秀でした。 ただ、日本語の手書きフォントとの相性が悪く、精度は85%程度。 改善はしたものの、まだ実用水準に届いていない。 3つ目で試したツールでようやく精度97%が出ました。 ここで「これなら回せる」と思った。 ところが、初月は逆に処理時間が増えました。 原因は明確で、AIの出力を1枚ずつ全項目チェックしていたからです。 金額、振込先、日付、勘定科目、摘要、消費税区分。 6項目×100枚超。 これでは手入力と変わらない。 正直に言うと、AIを信頼できなかった。 夜中にスプレッドシートを開いて、処理済みの請求書を見返していた時期もあります。 転機は運用2ヶ月目でした。 チェック項目を「金額」「振込先」「日付」の3つだけに絞った。 それ以外の項目はAIの判定をそのまま通す運用に切り替えました。 これだけで1枚あたりの処理時間が10分から2分に落ちた。 月の合計処理時間は20時間超から4時間前後へ。 「精度97%でも残り3%でミスが出るのでは」と思うかもしれません。 実際、3ヶ月間で発生したエラーは2件でした。 1件は日付の年号ズレ、もう1件は振込先の支店名誤認。 どちらもチェック対象の3項目に含まれていたので、目視で拾えている。 ちなみに、手入力時代のミス率を遡って確認したところ、月あたり平均3〜4件のヒューマンエラーが出ていました。 入力ミス、コピペ先の行ズレ、消費税の区分間違い。 AI運用後のほうがエラー率は低い。 デロイトの2024年調査では、経理部門のAI導入で平均40%の工数削減が報告されています。 うちの場合は約80%削減なので、「チェック範囲の絞り込み」が効いた部分が大きいと感じています。 もし同じことを試すなら、3つのステップを提案します。 まず、今の処理フローを1枚あたり何分かかっているか計測すること。 ストップウォッチで3日間、実測するだけで十分です。 体感と実測は必ずズレます。 次に、AI OCRツールを無料枠で試すこと。 Google Cloud Visionは月1,000リクエストまで無料。 Amazon Textractも月1,000ページまで無料枠がある。 自社の請求書フォーマットとの相性を、実データで確かめてください。 最後に、チェック項目を3つ以下に絞ること。 全項目チェックは「AIを導入した意味がない状態」です。 金額・振込先・日付。 この3つだけ人間が見れば、実務上のリスクはほぼカバーできます。 僕が一番時間を無駄にしたのは、「全部チェックしなきゃ」と思い込んでいた最初の1ヶ月でした。 AIの精度を疑うことと、AIの出力を全部見ることは別の話です。 信頼する範囲を自分で決める。 それだけで経理の景色はかなり変わりました。 あなたの業務で「ここだけは絶対に人間がやるべき」と確信している作業、最後に検証したのはいつですか。
1
2
46
90,795
20 AWS Modern Projects in the AI Era (2026) for Real-World Problem Solving 1. AI Customer Support Agent (Multi-Channel) → Problem Solved: Automates support across chat, email, and voice → Tech Stack: Amazon Bedrock, Lambda, API Gateway, DynamoDB, SES 2. RAG-Based Enterprise Knowledge Assistant → Problem Solved: Instant answers from internal documents → Tech Stack: Bedrock, OpenSearch, S3, Lambda 3. AI Resume Screening & Ranking System → Problem Solved: Faster hiring decisions → Tech Stack: Bedrock, Textract, Step Functions, DynamoDB 4. Meeting Intelligence Platform (Transcribe Summarize) → Problem Solved: Converts meetings into actionable insights → Tech Stack: Amazon Transcribe, Bedrock, S3, Lambda 5. Real-Time Fraud Detection Engine → Problem Solved: Detects anomalies in transactions instantly → Tech Stack: Kinesis, SageMaker, Lambda, DynamoDB 6. AI Content Moderation Pipeline → Problem Solved: Filters harmful or unsafe content → Tech Stack: Rekognition, Comprehend, Lambda, SNS 7. Autonomous Code Review Assistant → Problem Solved: Improves code quality automatically → Tech Stack: Bedrock, CodeCommit, Lambda 8. AI-Powered Recommendation Engine → Problem Solved: Personalized user experiences → Tech Stack: SageMaker, DynamoDB, API Gateway 9. Voice-to-Text Feedback Analyzer → Problem Solved: Converts voice feedback into insights → Tech Stack: Transcribe, Comprehend, S3, Lambda 10. AI Log Analyzer & Root Cause Detector → Problem Solved: Faster debugging in production → Tech Stack: CloudWatch, OpenSearch, Bedrock 11. Smart Cost Optimization Advisor (AI FinOps) → Problem Solved: Reduces cloud spending automatically → Tech Stack: Cost Explorer API, Bedrock, Lambda 12. AI-Powered E-Commerce Search Engine → Problem Solved: Intelligent product discovery → Tech Stack: OpenSearch, Bedrock, DynamoDB 13. Autonomous Incident Response System → Problem Solved: Auto-heals infrastructure issues → Tech Stack: EventBridge, Lambda, Systems Manager 14. AI Knowledge Base for Teams (Internal GPT) → Problem Solved: Improves team productivity → Tech Stack: Bedrock, OpenSearch, S3 15. Real-Time Social Media Sentiment Tracker → Problem Solved: Tracks brand sentiment instantly → Tech Stack: Kinesis, Comprehend, OpenSearch 16. AI Video Content Tagging System → Problem Solved: Auto-generates metadata for videos → Tech Stack: Rekognition Video, S3, Lambda 17. Multi-Tenant AI SaaS Platform → Problem Solved: Scalable AI services for multiple clients → Tech Stack: ECS, Bedrock, Aurora, Cognito 18. Edge AI Chat Application (Low Latency) → Problem Solved: Faster global AI responses → Tech Stack: Lambda@Edge, CloudFront, Bedrock 19. AI Document Processing Pipeline (OCR NLP) → Problem Solved: Extracts and understands documents → Tech Stack: Textract, Bedrock, Step Functions 20. Predictive Maintenance System (IoT AI) → Problem Solved: Prevents equipment failures → Tech Stack: IoT Core, Kinesis, SageMaker, Lambda ➡️ Master AWS with this AWS Projects Handbook: codewithdhanian.gumroad.com/…
5
18
94
4,067