About the Company
K-founded AI 전문 스타트업으로, 2016년 창립 이후 글로벌 마켓에서 검증된 성과를 이루어낸 회사입니다.
회사의 검증된 성과
- 글로벌 누적 8억 유저 보유 (메인 서비스)
- 글로벌 최대 3억 MAU 달성
- 창업 첫해부터 흑자 달성, 지속적 매출 및 영업이익 성장
- 1,500억 기업가치 달성 (설립 3년 만)
- 유명 벤처캐피탈로부터 두 차례 투자 유치
- 글로벌 멀티플랫폼 서비스 운영 노하우 6년 이상 보유
현재 사업 확장
- 기존 게임 & SNS 서비스의 안정적 수익화
- 생성형 AI, 챗봇, LLM 기반 신규 사업 본격 진행
- LLM과 Speech 모델을 결합한 대화형/실시간 에이전트 서비스 개발 중
- 2025년 일본 시장 진출 예정 (글로벌 확장 단계)
About the Role
Voice AI 시대의 핵심 기술을 개발하는 엔지니어
본 포지션은 텍스트-음성(TTS), 음성-텍스트(ASR), 그리고 LLM을 결합한 차세대 대화형 에이전트 서비스의 핵심 기술을 직접 연구·개발하는 역할입니다.
단순한 API 활용이 아닌, Neural Speech Codec 같은 최신 음성 기술부터 LLM 연동, 실시간 스트리밍 추론까지 엔드-투-엔드 기술 문제를 해결하며, 8억 글로벌 유저를 보유한 실제 서비스에 여러분의 기술을 적용하는 희소한 기회입니다.
[주요 업무 내용]
- LLM과 Speech 모델 통합: LLM과 음성 모델을 결합한 대화형/실시간 에이전트 서비스 아키텍처 설계 및 구축
- TTS/ASR 모델 개발·최적화: 텍스트-음성 변환(TTS), 음성-텍스트 인식(ASR) 모델의 개발, 최적화, 경량화
- Neural Speech Codec 연구: EnCodec, DAC, SNAC 등 최신 신경망 기반 음성 토큰화 기술 연구 및 LLM 연동
- 대규모 음성 데이터셋 설계: 대규모 음성 데이터 수집·정제·전처리 및 분산 학습 파이프라인 설계
- 최신 기술 분석 및 서비스 적용: 오픈소스·논문 기술 분석, 서비스 적용 가능성 평가 및 로드맵 수립
- End-to-End 서비스 최적화: 모델 학습부터 추론, 배포, 모니터링까지 전 과정의 성능 최적화
[자격 요건]
- 경력 2년 이상 또는 석사 학위 이상 준하의 전문 연구 역량 보유자
- 딥러닝 기반 음성 처리(ASR/TTS) 중 하나 이상 모델 구현 및 연구 경험 (실제 프로젝트 또는 논문 기반)
- 대규모 음성 데이터셋 가공/전처리 및 분산 학습 경험 (GPU 클러스터 환경 선택)
- AI 관련 논문, 특허, 국제 학회 발표 경험 (최소 하나 이상)
- Transformer, Conformer, Flow-matching, Diffusion 기반 모델 구조에 대한 깊이 있는 이해
- Python, PyTorch 기반 연구·개발 능력 (프로덕션 코드 작성 경험 포함)
- 컴퓨터공학, 전기전자, 음성신호처리 등 이공계 석사 학위 이상 (박사 우대)
[우대 사항]
- 멀티스피커/멀티언어 음성 합성 경험: 다양한 음성 스타일, 감정 제어 TTS 개발 경험
- LLM과 Speech 모델 통합 프로젝트: 실제 서비스 또는 프로토타입 경험
- Neural Speech Codec 기반 TTS fine-tuning: LLaSa, CosyVoice, Orpheus 등 최신 모델 경험
- Streaming Inference 최적화: 실시간 스트리밍 기반 음성 생성 경험
- ASR 최신 모델 활용: Whisper, Parakeet, Paraformer 등 Transformer/Conformer 기반 모델 경험
- Self-Supervised Learning: HuBERT, WavLM, wav2vec2 등 음성 표현 학습 경험
- 서브컬처 + AI 관심도: 애니메이션, 게임, 음성 합성 등 창의적인 분야와 AI 접목에 관심 있는 분
- 일본어 능력 (일본어 데이터셋 처리, LLM/논문 이해 가능자)
[이런 분들께 적합합니다]
- 음성 처리와 LLM 기술의 경계에서 혁신을 만들고 싶은 AI 엔지니어
- 기초 연구와 서비스 임팩트를 동시에 경험하고 싶은 분
- 최신 AI 기술(Neural Speech Codec, Diffusion, Flow-matching)을 직접 서비스에 적용하며 실력을 쌓고 싶은 분
- 8억 글로벌 유저를 보유한 실제 서비스에서 기술의 가치를 증명하고 싶은 분
- AI 업계 최전선에서 차별화된 커리어 포트폴리오를 구축하고 싶은 분
- 스타트업의 빠른 의사결정과 대기업의 안정성을 동시에 경험하고 싶은 분
[근무 환경]
- 근무 형태: 정규직
- 근무 장소: AI 스타트업 본사 (경기 판교)
- 근무 시간: 주 5일, 10:00~19:00 (시차 출퇴근제 운영)
- 조직 특성: 기업부설연구소 중심 (30명 AI 팀 + 4명 연구진)
[연봉 및 처우]
- 연봉: 업계 상위 수준 / 현 연봉수준 +α / 학력·경력·역량에 따른 협의
- 복리후생:
- 건강한 회사식 (케이터링)
- 매주 새로운 간식 지원
- 연장근무시 저녁식사 지원 (1인 2만원 한도)
- 야간근무시 교통비 지원
- 연차·반차·반반차 제도
- 경조사 지원
- 본인/배우자 생일, 결혼기념일 선물
- 월 주차비 50% 지원
- 연 1회 종합건강검진
[채용 절차]
서류 전형 → 1차 면접 → (기술 과제 또는 추가 전형) → 2차 면접 → 처우 협의 → 최종 합격
[Why This Role Matters: 포지션의 전략적 가치]
Pro (강점)
1. 검증된 글로벌 성공 DNA 일반적인 AI 스타트업과는 다릅니다. 이미 글로벌 8억 유저, 3억 MAU라는 압도적 성과를 증명한 회사가 AI 신사업에 도전하는 것이므로, 스타트업 특유의 불확실성 리스크가 현저히 낮습니다. 창업 첫해부터 흑자를 달성하고 3년 만에 1,500억 기업가치를 인정받은 검증된 비즈니스 역량 위에서 음성 AI를 개발합니다.
2. Voice AI 기술의 최전선 경험 LLM과 Speech 모델을 결합한 대화형 에이전트 서비스는 현재 AI 업계에서 가장 주목받는 분야입니다. Neural Speech Codec(EnCodec, DAC, SNAC), TTS/ASR 최신 기술(Whisper, CosyVoice, Orpheus 등)을 직접 연구·개발하며, 업계 최전선의 기술력을 빠르게 축적할 수 있습니다.
3. R&D 중심 환경 + 실제 서비스 적용 기업부설연구소를 운영하며 최신 논문·오픈소스 기술 분석부터 서비스 적용 전략 수립까지 End-to-End 연구 경험이 가능합니다. 단순 논문 재현이 아닌, 8억 유저를 보유한 글로벌 서비스에 실제 적용하는 경험은 연구자로서 희소한 커리어 자산입니다.
4. 카카오 출신 리더십 + 수평적 문화 카카오 출신 공동대표의 검증된 리더십 아래, 영어 호칭, 직급 없는 수평적 조직문화에서 주도적으로 프로젝트를 이끌 수 있습니다. 대기업의 안정성과 스타트업의 역동성을 동시에 경험할 수 있는 환경입니다.
5. 글로벌 확장 시점의 핵심 멤버 기회 2025년 일본법인 설립, 글로벌 시장 진출을 앞두고 있습니다. Voice AI 기술을 글로벌 무대로 확장하는 과정에서 핵심 기술 리드로 성장할 기회입니다.
6. 재정 안정성 창업 첫해 BEP 달성, 지속적인 매출/영업이익 성장, 벤처캐피탈 두 차례 투자 유치로 재정적으로 매우 안정적입니다. "번아웃 없이 오래 일할 수 있는 회사"를 찾는 분에게 적합합니다.
Cons (고려 사항)
1. 높은 기술 진입 장벽 딥러닝 기반 음성 처리(ASR/TTS) 모델 구현, Transformer/Conformer 구조 이해, 대규모 음성 데이터셋 처리 경험 등 진입 장벽이 높습니다. 석사 이상 학력 또는 이에 준하는 연구 역량이 필수이므로, 관련 배경이 부족한 경우 초기 학습 곡선이 가파를 수 있습니다.
2. 콘텐츠 노출 특성 업무 특성상 일본 시장 진출 관련 특정 콘텐츠 유형에 노출될 수 있습니다. 개인의 가치관과 업무 환경이 일치하는지 사전에 충분히 검토하시기 바랍니다.
3. 신사업 조직의 불확실성 AI 엔지니어 포지션은 기존 게임 사업과 별개의 신사업 영역입니다. 신규 사업 특성상 방향성 변화나 우선순위 조정이 있을 수 있으며, 명확하게 정해진 프로세스보다는 스스로 길을 개척해야 하는 상황이 많을 수 있습니다.
[종합 평가]
Voice AI와 LLM 기술이 폭발적으로 성장하는 현 시점에서, 본 포지션은 매우 전략적인 경력 기회입니다.
특히 주목할 점은, 회사가 "아직 검증되지 않은 스타트업"이 아니라 이미 글로벌 성과를 증명한 검증된 조직이라는 점입니다. Neural Speech Codec, TTS/ASR 최신 모델을 실제 글로벌 서비스에 적용하는 경험은 향후 빅테크, AI 스타트업, 연구소에서 높이 평가받는 핵심 역량이 될 것입니다.
기술적 깊이와 서비스 임팩트를 동시에 원하는 분에게 적극 추천합니다. 다만, 높은 기술 요구 수준과 신사업 특성은 지원 전 객관적으로 점검하시기를 권장합니다.
[포지션 매칭 및 프로필 등록]
관심 포지션에 즉시 매칭 되지 않더라도, 향후 유사한 R&D Finance 리더십 기회가 열릴 경우 우선적으로 연락 드릴 수 있도록 사전 프로필 등록을 권장합니다.
포지션 매칭 및 프로필 등록하기 →
관심 포지션에 즉시 매칭 되지 않더라도, 향후 유사한 리더십 기회가 열릴 경우 우선적으로 연락 드릴 수 있도록 사전 프로필 등록을 권장 드립니다.
#VoiceAI #AIEngineer #LLM #SpeechProcessing #TTS #ASR #AI채용 #스타트업채용
━━━━━━━━━━━━━━━━━━
Explore MyNext
[Home] [Coaching] [Open Positions] [AI Playbook] [Notes] [About Thomas] [Testimonials] [FAQ] [Contact]
━━━━━━━━━━━━━━━━━━