최근 우리 회사 개발팀에서 오픈 소스 저장소인 GitHub가 만든 Copilot을 전격 도입했다. 코파일럿은 깃허브에 있는 공개된 오픈 소스를 학습하여 프로그래머에게 인공지능이 생각하는 최적의 코드를 추천한다.
한마디로 주석과 함수명을 보고 그 기능을 추측해서 프로그래머에게 코드를 추천하는 것이다. 코파일럿 도입으로 인해 단순 노가다 코드는 코파일럿이 담당하게 되었다. 물론 단점이 없는 것은 아니다. 주석이나 함수명이 불분명할 경우 애매한 코드를 추천하는 경우가 있다.
그럼에도 불구하고 10번 중 몇 번은 정말 내가 생각하던 코드를 제대로 만들어준다. 단순 반복적인 코드에서 벗어나 코딩 생산성이 좋아졌다.
코파일럿은 오픈AI(OpenAI)의 GPT-3에서 파생된 코덱스(Codex)를 이용하여 깃허브에 있는 공개 소스를 학습했다. 코파일럿은 2021년 기술 프리뷰로 출시됐다. 깃허브에 따르면 프리뷰 기간 동안 120만 명이 가입했으며 현재 코드의 거의 40%가 코파일럿에 의해 작성 되었다고 한다.
코파일럿은 프리뷰 기간 동안 영어 주석만 이해하다가 최근에는 한국어 주석을 이해하고 소스 코드를 프로그래머에게 제안했다.
물론 논란도 없지 않다. 바로 깃허브에 저장된 소스 코드 저작권 문제이다. 학습 데이터로 사용한 원본 소스 중에 저작권에 저촉되지 않는 자료가 없다고 장담하기 힘들다. GPL 라이선스 주석을 제거하여 소스를 복사한 프로젝트도 널린 것이 깃허브이다. 이 경우 코파일럿은 공개 계정의 소스로 인식하고 실수로 저작권을 침해하여 학습할 수 있다.
스타트업의 초기 프로젝트의 경우 깃허브 유료 계정을 사용하는 것이 부담스러울 때가 있다. 그래서 누구나 볼 수 있는 퍼블릭 계정으로 개발하다가 상업 유료 계정으로 전환하는 사례도 있다. 이런 소스의 경우 코파일럿의 학습 데이터에 포함될 경우 저작권 문제는 누가 책임질 것이냐가 문제가 된다.
1826년 조셉 니세포르 니엡스가 사진을 발명한 후 많은 화가들은 사진관을 차렸다고 한다. 초상화를 그리던 수요가 줄어들고 좀 더 저렴하고 시간이 절약되는 사진으로 화가들이 전직한 것이다.
그렇다면 사용자가 묘사하면 프로그래머 없이 코딩하는 인공지능 코딩 프로그램은 등장하게 될까? 물론 머지않아 출시될 것이다.
하지만 사진기의 발명으로 다수의 화가가 사진관을 개업한 것과 같은 사태는 일어나지 않을 것이다. 비행기의 발전에서 우리는 그 힌트를 얻을 수 있다. 최근 만들어지고 있는 상업 항공기의 경우 자동 비행 기술인 오토 파일럿을 지원하고 있다. 오토 파일럿은 장거리 비행에 있어서 기장의 피로도를 낮추고 안전한 비행에 도움을 주고 있다. 오토 파일럿 모드가 있더라도 항공기 기장은 비행에 핵심 역할을 하며 역할 분담을 하고 있다.
코파일럿과 같은 프로그램 코드를 만들어주는 서비스는 더욱 더 고도화되고 정밀해질 것이다.몇 년 이내 코파일럿과 같이 인공지능 소스 코드 추천 프로그램은 더 많아지고 일반화될 것이다. 지루하고 반복적인 코드와 테스트 케이스를 만드는 일 등은 인공지능이 담당하게 될 것이고 이제 프로그래머들은 창의적인 코드와 고도의 추상적인 개발에 더 집중하게 될 것이다.
필자 소개: 베타랩스 김호광 대표는 블록체인 시장에 2017년부터 참여했다. 나이키 Run the city의 보안을 담당했으며, 현재 여러 모바일게임과 게임 포털에서 보안과 레거시 시스템에 대한 클라우드 전환에 대한 기술을 지원하고 있다. 최근 관심사는 사회적 해킹과 머신 러닝, 클라우드 등이다.