dukim's blog

[WK08-Day035][21.09.24.Fri] 특강 AI 엔지니어로서 알면 좋을 지식들 본문

Boostcamp AI Tech 2th

[WK08-Day035][21.09.24.Fri] 특강 AI 엔지니어로서 알면 좋을 지식들

eliza.dukim 2021. 9. 27. 09:10

Intro

  • 새로운 팀과의 두 번째 피어세션
  • 어제에 이은 특강, 개인적으로 이준엽님의 Full Stack ML Engineer와 박은정님의 AI 시대의 커리어 빌딩 특강이 제일 도움이 되었다. 그동안 두루뭉술하게 알고 있던 각 포지션별 직무나 일과, 필요 역량에 대해 알 수 있었던 특강이었다.

학습 회고

이준엽 - Full Stack ML Engineer(FSML)

  • Full Stack ML Engineer : DL 연구를 이해하고 ML Product로 만들 수 있는 엔지니어
    • 장점 : 빠른 프로토타이핑 가능, 다른 포지션의 엔지니어에 대한 이해로 협업에 장점, 모든 방면에서 성장 가능
    • 단점 : 깊이가 얕아질 수 있음, 많은 시간을 투자해야함
  • ML Product 개발 과정
    • 요구사항 전달 -> 데이터 수집 -> ML 모델 개발 -> 실 서버 배포
  • ML Team 구성
    • 프로젝트 매니저, 개발자, 연구자, 기획자, 데이터 관리자
  • FSML의 업무
    • Job 1. 실 생활 문제를 ML 문제로 Formulation
    • Job 2. Raw Data 수집
    • Job 3. Annotation tool 개발
    • Job 4. Data version 관리 및 loader 개발
    • Job 5. Model 개발 및 논문 작성
    • Job 6. Evaluation tool 혹은 Demo 개발
    • Job 7. 모델 실 서버 배포
  • Roadmap
    • Stackshare
      image
    • 조언
      • 익숙한 언어 + 가장 적은 기능 + 가장 쉬운 framework로 시작할 것
      • 처음부터 잘 하려고 하지 말고 최대한 빨리 완성하기
      • 각 Stack 가운데서도 전문분야를 정하기
      • 새로운 것에 대한 두려움을 없애기 위해 반복적으로 접하기
      • 하나의 논문을 구현하고 Demo page 만들어보기

오혜연 - AI Ethics

  • AI가 개인, 사회, 인류에 미치는 문제
  • AI가 끼치는 긍정적인 영향

박은정 - AI 시대의 커리어 빌딩

학교 vs 회사

  • 두 조직의 목표의 차이 이해하는 것이 중요
  • 논문을 쓰고 싶다 → 학교
  • 상품 / 서비스 제작하고 싶다 → 회사 ← 특강 내용

AI를 다루는 회사의 종류

  • AI for X : AI로 기존 비지니스를 더 잘하려는 회사
    • 비용 줄이기, 품질 높이기
    • AI는 보조 수단, 대부분의 회사
  • AI centric : AI로 새로운 비즈니스를 창출하려는 회사
    • 새로운 가치 창출에 AI 활용
    • 신생회사가 많음

AI를 다루는 팀의 구성

  • Business
    • 사업 기획자
    • 서비스 기획자
    • 마케팅/세일즈/PR
    • 법무/윤리학자
  • Engineering
    • Data Engineer
    • AI Engineer
    • AIOps Engineer

Careers in AI: Engineering

  • AI/ML 모델링은 팀 전체 업무의 일부
  • 다양한 업무가 있는 만큼 다양한 역할이 있다
  • 또한 각 역할에 대한 필요 역량의 정도도 다르다
  • 각 포지션의 모집공고를 꼼꼼히 읽을 것
  • 다양한 역할이 있고 100%로 해당 역할을 하는 경우는 없다

Trends in AI engineering positions

  • 모델링에 대한 수요는 줄어들 가능성이 있다
  • 개인의 강점을 고려해 엣지를 살릴 수 있는 포지션 찾는 것이 중요(AI + $\alpha$)

필요 역량

  • CS 기본 이해, SW Engineering 능력
  • 영어 독해능력
  • Grit, Humility, Passion, Teamwork, Kindness
  • 스펙으로 모든 걸 다 잘 하기보다는 강력한 한방이 필요(e.g. AI Competitions, Publication record, 서비스 경험 등)

박성준 - 자연어 처리를 위한 언어 모델의 학습과 평가

  • 언어 모델의 자연어이해 능력을 평가하기 위한 벤치마크 소개
  • 한국어 벤치마크에 대한 소개

한국어 자연어 이해 벤치마크(KLUE)

  • 개체명 인식(Named Entity Recognition)

  • 품사 태깅 및 의존 구문 분석(POS tagging+Dependency Parsing)

    • 기존 벤치마크들은 의미위주 평가로 이뤄져있는데 문법적인 부분에 대한 체킹도 필요하기 때문에 해당 벤치마크가 추가됨
  • 문장 분류(Text classification)

  • 자연어 추론(Natural Language Inference)

  • 문장 유사도(Semantic Textual Similarity)

  • 관계 추출(Relation Extraction)

    • 문장에서 등장한 두 entity의 관계 예측
    • 해당 task를 잘 한다는 것은 텍스트에서 자동적으로 지식그래프같은 정제된 데이터베이스를 잘 만들 수 있다는 것을 의미
  • 질의 응답(Question & Answering)

    • GLUE나 다른 벤치마크에선 포함되어있지 않지만 질의응답 능력도 언어 이해에 대한 평가에 중요한 방식으로 여겨지고 있기 때문에 포함
  • 목적형 대화(Task-oriented Dialogue)

    • 최근 언어모델을 활용해 대화 패턴을 잘 이해하고 유의미한 정보를 뽑아내는 것이 연구 및 산업계의 이슈
    • 문장이나 문서가 아닌 대화를 잘 이해하는지
    • 최근 연구 트렌드를 반영(Amazon의 DialGLUE)

피어세션

  • 대회 전략 회의
  • 팀 그라운드룰 작성 및 제출
  • wandb 프로젝트 생성

오피스아워

  • 아래 두 가지 주제로 진행됨, 개인 노션에 정리
  • 시각화 대시보드 프로젝트 기본 프로세스 - 장유진
  • Visual Analytics의 필요성 - 이호준

학습 회고

  • 연휴동안 너무 푹 쉬지말았어야했다. 쉬는데 관성이 생겼는지 집에서는 집중이 되지않아 결국 집 밖으로 나와 학습했다.
  • 특강은 가볍게 듣고 지난주부터 밀려있던 학습정리를 작성하는데 시간을 할애했다. 앞으론 밀리지 말자.
Comments