🤖 AI実験室
14倍遅くなった日、Qwen3 32Bで安定した日
OCR校正用のローカルLLMを選ぶのに、OOM・タイムアウト・thinking暴走を経験した。最終的にQwen3 32Bのthinking抑制で14.6倍の速度改善を得た話。
Claude Code / ローカルLLM / RTX活用 / OCR・TTS
OCR校正用のローカルLLMを選ぶのに、OOM・タイムアウト・thinking暴走を経験した。最終的にQwen3 32Bのthinking抑制で14.6倍の速度改善を得た話。
tmuxとは何か、なぜ必要かを理解するところから、Claude Codeのサブエージェント・エージェントチームの違い、セキュリティ設定、使い方までをまとめた非エンジニア向けガイド。
OCRで取り出したテキストをLLMに校正させたら、文章が要約されたり消えたりした。前処理の順番を間違えると、AIは暴走する。
ChatGPT、Claude、Gemini、Grok、Copilot……半年以上AIツールを乗り換え続けた非エンジニアが、最終的にClaude Code+Copilotの二刀流に落ち着いた記録。
PDF小説の音声化を目指してTesseractでOCRしたら文字化けだらけ。日本語特化のYomiTokuに切り替えるまでの試行錯誤の記録。
読み聞かせで先に寝落ちする父親が、OCR+TTSで"自分のために本を読んでくれる仕組み"を作れないかAIに相談してみた。開発への第一歩の記録。
AIの普及でPC作業が増え、マウス・キーボード・テンキー・音声入力と入力環境を一新。音声入力×AIの組み合わせが想像以上に快適だった記録。
工場勤務の元自動車整備士が、ChatGPTとの出会いをきっかけにブログを始めた理由。非エンジニアがAI時代に「作る側」を目指す記録のはじまり。