dukim's blog

[WK08-Day035][21.09.23.Thu] Level2 P-stage 시작, 새로운 팀, 특강 AI 엔지니어로서 알면 좋을 지식들 본문

Boostcamp AI Tech 2th

[WK08-Day035][21.09.23.Thu] Level2 P-stage 시작, 새로운 팀, 특강 AI 엔지니어로서 알면 좋을 지식들

eliza.dukim 2021. 9. 27. 08:08

Intro

  • Level2 P-stage 시작됨, 새로운 팀과 밋업을 가지고 다음주 계획을 세움
  • 추석 연휴로 인해 목, 금 이틀간만 교육이 진행됨
  • AI 엔지니어로서 알면 좋을 지식들을 주제로 특강 진행
  • 이번 파트는 나중에 제가 찾아보기 위한 용도로 적은 포스팅이라 생략된 내용이 많습니다.

학습 내용

이활석 - 서비스 향 AI 모델 개발하기

현업에서 학습 데이터셋을 마련하면서 겪게되는 일 & 모델 성능 평가에서 고려할 사항

image

개발 프로세스 효율성을 위한 조직 구성 & AI 상품화 과정에서 필요한 전체 업무 리스트

image

AI 입문자에게 도움이 될 조언들

  • 개발자에서 AI 관련 개발로 전환하는 경우 : Model Engineering / Tool / Serving 은 개발력이 많이 필요하며, 앞으로 수요가 많아질 것으로 예상. 너무 AI 모델링으로 넘어가지는 말 것.
  • 모델러의 경우: 한 분야 모델링 전문성도 중요, 그러나 점점 모델링은 자동화되고(e.g. AutoML, 관련 툴) 인력 수도 늘어나니 + $\alpha$를 가질 것(FE 개발 능력 확장, BE 개발 능력 확장, AI 기술 분야 확장)
  • 기술 트렌드에 민감해야한다

김상훈 - 캐글 그랜드마스터의 노하우 대방출

Competition Tip

  1. 파이프라인의 (빠른/효율적) 반복
    • 개인 장비 활용, 시간투자, 본인만의 기본 코드
  2. 점수 개선 아이디어
    • 캐글 Notebooks, Discussion 탭 참고
  3. (올바른 방향인지) 탄탄한 검증 전략
    • K-fold CV
  4. 기타
    • 앙상블 : Stratified K-fold, 모델 앙상블, 블렌딩(모델 별 예측값을 weight sum으로 섞기)
    • 대회에서 좋은 성적을 내려면 높은 점수의 싱글 모델이 필요함, 대회 종료 1~2주 내로 싱글 모델 점수로만 50등 내에 드는 것이 좋다
    • 코드 관리 : 추후 앙상블을 위해 v1, v2, v3, ... 순서로 개별 폴더를 만들어 관리. 버전별 전처리된 데이터, 모델 파일을 저장.
    • 주피터에서 터미널 열기 : 크롬 창을 닫아도 원격 학습가능

구종만 - AI + ML과 Quant Trading

  • 흥미로운 주제긴 했으나 나에겐 관련이 없는 주제라 따로 정리하진 않음

문지형 - 내가 만든 AI 모델은 합법일까, 불법일까

  • 저작권법 경계 내에서 데이터 제작 방식 소개
  • KLUE paper day에서도 대부분 소개된 내용이므로 따로 정리하지 않음

피어세션

  • 팀 목표 수립
  • 그라운드룰 정하기
  • 코드 작업 방식 논의

학습회고

  • 이활석님의 특강 주제가 가장 궁금했던 내용이었기에 도움이 많이 되었다. 회사와 연구소의 차이, 그리고 취업시 갖춰야할 기술 스택에 대한 궁금증이 해소되었다.
Comments