1 概要
Gen AI と GitHub Copilot のようなツールは、2025 年 4 月より、プログラマーを深刻な任務に置き換えるのにそれほど優れていません。 インターネットで見られる多くの主張は、既存の AI ツールを販売しようとしている マーケティングキャンペーン、または 非常に楽観的な主張であり、現在存在する実際のツールで経験に基づいていない です。インターネットで見た発言 statements seen on the Internet インターネットで見た声明マーケティングキャンペーンマーケティングキャンペーンあまりに楽観的な発言は経験に基づいていないtoo optimistic statements not based on experience 経験に基づかない非常に楽観的な声明
この記事では、上記の主張を支持するインターネット上の3つの記事の概要を提供しており、最後の1つはこの著者のGitHub Copilotでの個人的な開発経験です。
2.第1条 AIエージェントは、ソフトウェアを信頼できるようにデバッグできません。AIエージェントは、ソフトウェアを信頼できるようにデバッグできません。
Article 1: AI isn’t ready to replace human coders for debugging, researchers say
AI isn’t ready to replace human coders for debugging, researchers sayAI isn’t ready to replace human coders for debugging, researchers say
概要:
- ツールへのアクセスを与えられた場合でも、AIエージェントは、ソフトウェアを信頼できるようにデバッグすることはできません。
- .. (人々)は、デバッグの部分でモデルが十分に優れていないため、彼らの期待を調整し、デバッグは開発者の時間のほとんどを占めています。これはMicrosoft Researchの強力な提案です。
AIモデル...経験豊富な開発者ができることから遠く離れています ... 開発者を直接置き換えるAIエージェントに関する野心的なアイデアのいくつかは、現実とはかなり遠い ... モデルは、バグやセキュリティの脆弱性に満ちたコードをツールへのアクセスを与えられても、AIエージェントはソフトウェアを信頼できるようにデバッグすることはできません。..(人々)は、モデルがデバッグの部分で十分に優れていないため、期待を調整し、デバッグは開発者の時間の大半を占める。suggestion of Microsoft Research. よりAIモデル...経験豊富な人間の開発者ができることとは遠い。...AIエージェントが開発者を直接置き換えるという野心的なアイデアのいくつかは、現実とはかなり遠い...モデルは、バグやセキュリティの脆弱性に満ちたコードを生成する傾向があり、これらの問題を修正することは一般的にできない。. the best outcome is an agent that saves a human developer a substantial amount of time, not one that can do everything they can do. . 最良の結果は、人間の開発者にかなりの時間を節約するエージェントであり、彼らができることは何でもできるエージェントではない。3>第2条 AIを採用する圧力の下、開発者はますます失望している
AIを採用する圧力の下で、開発者はますます挫折しています
Article 2: AI coding mandates are driving developers to the brink
AI coding mandates are driving developers to the brinkAI coding mandates are driving developers to the brink
概要:
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- ..AIの採用は、リーダーシップとそのようなツールを採用する従業員の間で分裂が生じるにつれて、彼らの会社を“分断”している。特にソフトウェア開発者にとっては、AIコーディングツールがコードにエラーを導入し、多くのタスクに失敗し、技術的負債を増加させているという懸念がある。
- ...AIコーディングツールへの開発者の信頼は急速に低下した
- ...開発者は、AIコーディングツールに関連する多くの技術的な問題と頭痛を説明し、どのように頻繁に間違ったコードを提案し、既存のコードを削除するか、デプロイメントで引き起こす多くの問題まで。AIツールの使用は、事件の増加を引き起こしており、Harnessの回答者の68%が、AI関連のセキュリティの脆弱性の解決に今よりも多くの時間を費やしていると回答しています。
- GitHub Copilot...それは正しいほど何度も間違っていた
- 誰かが (人間) が (AI ツール) が実際に完全に書いたり理解しなかったものをレビューするのに時間がかかります
- Executives mismanage their expectations ... エンジニアリングワークフローに近い可視性がない企業のリーダー
- AIコーディングツールはまだ新しいものであり、これらのツールを効果的に使用する方法を知るには、協調的な努力が必要です。
4. 第3条 GitHub Copilot (GHC) は、少し複雑なタスクでは信頼できない
GitHub Copilot (GHC) は、少し複雑なタスクでは信頼できないArticle 3: GitHub Copilot (Gen-AI) is Helpful, But Not Great
GitHub Copilot (Gen-AI) is Helpful, But Not GreatGitHub Copilot (Gen-AI) is Helpful, But Not Great
概要:
コピロットコピロット(GHC)のコピロットコピロット(GHC)のコピロットコピロットコピロット(GHC)のコピロットコピロットコピロット(GHC)コピロットコピロットコピロット(GHC)コピロットコピロットコピロットコピロット(GHC)コピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピロットコピ - GitHub Copilot (GHC)... 時には素晴らしい... 時には時間を無駄にします、特にそれが与える言葉の答えはしばしば話題外です
- それは時には役に立ちますが、局所的な範囲の問題にのみ適用され、より大きな画像を見ることができません。「個人的な感覚」は「よく知らない」、「推測しようとしている」、そして、数百万行のコードを記憶する巨大なメモリを持つマシンであるため、推測は時には明るく、時には話題外である。
- .. C# シンタクスを常に正しく取得できず、C# 属性/方法の存在を単独でチェックできないという大きな失望。
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- 私はGHCの「ゴーストテスト」を多く使用し、それをレビューし、それらが気に入ったときに提案を受け入れます。
- I use the GHC text-prompt page to ask for the generation of snippets or small functions with clear functionality.... GHC will succeed here, but if it does, it can be brilliant.
- I no longer try larger changes involving 3-4 files at the same time... Answers are at best incomplete, with many errors, like C# properties and methods that do not exist (it hallucinates?)
- ... それは時間とエネルギーを消費 REVIEW each answer GHC provides
- ...It hallucinates about C# properties and methods that do not exist for well-known and frequently used APIs...
- ...それは4つのファイルを含む割り当てられたパターンベースのタスクのために、有用なコードよりも混乱を生成します。
- I ask GHC for help with problems, but read max 2 chat replies. Its answers tend to be verbose... If it doesn't give me a good answer in 2 attempts, I will go read Google for the same problem.
- GHCには深刻な焦点問題があり、答えはしばしば話題外です。
- GitHub Copilot (GHC) は、同時に複数のファイルを含む複雑なタスクを信頼することはできません. In such scenarios, results are incomplete and not time-efficient compared to direct manual programming.
- GitHub Copilot (GHC) は、存在しない C# 方法や属性について幻想する傾向があります。
- 生成されたコードはすぐにコンパイルされず、完成するには多くの手動作業が必要です。
5
上記の記事は、開発者を直接置き換えるAIツールに関する野心的なアイデアの一部が現実とはかなり遠いことを示唆しています。
一部の著者は、開発者を直接置き換えるのではなく、人間の開発者に相当する時間を節約するAIツールが、最良の結果である可能性があると信じている。
6 参照
[1] AIはデバッグのための人間のコーディネーターを置き換える準備ができていないと研究者らは言う
https://arstechnica.com/ai/2025/04/researchers-find-ai-is-pretty-bad-at-debugging-but-theyre-working-on-it/
https://arstechnica.com/ai/2025/04/researchers-find-ai-is-pretty-bad-at-debugging-but-theyre-working-on-it/
[2] AI コーディングの任務は、開発者を最前線へと導いている
https://leaddev.com/culture/ai-coding-mandates-are-driving-developers-to-the-brink
https://leaddev.com/culture/ai-coding-mandates-are-driving-developers-to-the-brink
[3] GitHub Copilot (Gen-AI) is Helpful, But Not Great (March 2025)
https://markpelf.com/2717/github-copilot-gen-ai-is-helpful-but-not-great-march-2025/
https://markpelf.com/2717/github-copilot-gen-ai-is-helpful-but-not-great-march-2025/