[강연 및 세미나] : 모두를 위한 ML / Data, ML, Service, and Platform

모두를 위한 ML / Data, ML, Service, and Platform

참석일 : 21.12.29
유형 : 실시간 온라인 강연
주제 : 머신러닝과 데이터 이야기
발표자 : 박종천 님

참고 링크 : https://okky.kr/article/1123562

OKKY 커뮤니티에서 박종천님이 발표하는 머신러닝과 데이터에 관한 세미나에 참석했다.

머신러닝과 데이터 분석에 관심은 있지만 평소에 잘 모르는 부분이 많기도 했고 아직은 시기상조인 것 같아서 디테일하게 접근해 본 적이 없기 때문에 이 기회에 뼈대라도 세워두자라는 마음으로 신청을 하게 되었다.

우선, 말씀이 매우 빠르시다. 덕분에 알찬 강의가 되었지만 놓치는 부분이 있을까봐 조마조마 하면서 정신 바짝 차리고 들었다. 강의 순서가 너무 좋았다. 머신러닝의 시대가 오고 있는 것부터 천천히 자연스러운 전개에 머릿속에 잘 들어오는 강연이었다.

강의를 들으면서 놓치고 싶지 않아 필기하면서 들었는데 강의 끝나고 복습하면서 내용 정리 좀 했다. 이렇게 복습을 하고 보니 나는 머신러닝과 데이터에 관해 빙산의 일각도 알지 못 했다는 생각이 들었고 이번 강의를 통해 알아가는게 너무 많다는 것을 느꼈다.

시대가 변하면 떠오르는 회사가 나온다는 말도 다가왔고, 우리는 ML을 잘 할 필요는 없지만 활용하고 이해할 수 있어야 한다는 부분도 너무 좋게 다가왔다. 머신러닝을 위해 결국 핵심은 데이터고 이 데이터도 그냥 데이터가 아닌 좋은 데이터(추상적일 수도 있지만 강의를 듣다 보면 느낌으로 이해하게 된다.)이어야 한다는 것이 설명으로써 이해가 되기도 했다.

그러면서 이 머신러닝을 위한 데이터 자체가 끊기면 안 된다는 느낌의 말도 했다. 이런 부분은 떠올려보지 못 한 부분인데 중요한 파트인 것을 캐치하기도 했다. 우리는 머신러닝, 딥러닝 자체를 개발할 수학에 미친 영어 논문을 보고도 꿀잠 잘 수 있는 사람이 아니기 때문에 앞으로 나오고 있고, 나올 ML 플랫폼을 어떻게 활용할 수 있을지에 대한 공부가 필요하다는 것을 느꼈다.

강의 내용이 너무 좋아서 복습을 하고 같이 공부하는 동생한테 전화해서 내가 다시 강의를 했다. 역시 남에게 알려주는 것이 공부가 제일 잘 된다고 강연을 듣고 복습하고 누군가에게 정보를 전달. 끝내준다.

아, 강의 끝나고는 사전에 받은 질문에 대해서도 답해주었는데 ML 관련이 아닌 질문에서 흥미로운 질문 몇 개를 적었다. 아직 나는 신입 개발자니까 이에 관련된 내용이다.

박종천님은 똑똑하고 부지런하고 착한 개발자를 뽑으신다고 했다. 똑똑한 것은 말 그대로 스마트한지 보는 것 같고 부지런 한 것은 믿고 맡길 수 있는가, 착한이란 팀워크를 위해 희생할 수 있는 이런 인재를 뽑으신다고 했다. 나였어도 이런 사람들을 뽑을 것 같다. 똑똑하다..라는 것은 노력으로 어떻게 건들 수 있는 게 아닐지 모르겠지만 부지런함과 착함은 노력으로 가능한 것 같으니 똑똑해지려 노력하면서 부지런해지고 착해져야겠다. 주문처럼 뚝딱 되는 게 아니지만 모순되게도 부지런하면 될 것 같으니 화이팅이다.

또, 신입 개발자에게 사수가 중요하다고 했다. 내부사수와 외부사수.. ( 사수를 내,외로 구분할 수 있는 걸 처음 알았다. 꿀팁)회사 내부에서 사수도 중요하지만 외부 사수도 중요한 것 같다. 요즘 다른 회사는 어떻게 돌아가는지 판단하고, 본인이 다니는 회사와 비교해서 어떻게 발전을 꾀할 수 있으니 좋은 것 같다는 생각이다.

여튼, 오늘 세미나 너무 만족스러웠고 앞으로 이런 기회가 온다면 또, 참여할 예정이다.

아래는 세미나를 들으면서 공부한 내용이다. 너무 좋은 내용이니 나중에 강연을 유튜브에 올린다고 했던 것 같은데 찾아서 보는 것을 추천한다.

시대가 변하면 회사가 나온다.
- 새로운 시대가 머신러닝의 시대고 이를 이끄는 회사가 흥한다.
데이터 기반? 주먹구구식?
- 디지털 트렌스포메이션
  - 데이터 기반 결정 등
  - 4가지 역량
    - 기술, 데이터, 프로세스, 조직변화역량
결국 데이터로 귀결된다.
- 데이터를 통해 의사 결정
- 데이터를 누가 보나?
  - 사람→시각화 필요
    - 개인화로 가면 데이터가 많아 불가능하므로 기계가 한다.
    - 결국 기계화 하여 기계가 개인화를 한다.
      - 머신러닝, 인공지능
데이터는 프라이버시가 중요하다.
머신러닝(인공지능) → 기계 학습 → 점점 똑똑해 진다. → 딥러닝(머신러닝포함)
데이터 + 룰 → 컴퓨터 → 결과였다면 이제는 데이터+ 결과 → 컴퓨터 → 룰
- 컴퓨터가 룰을 뽑아내는 것
  - 창조적이고 새로운 일을 할 수 있다.
룰을 찾아내는 방식이 있어야 한다.
- AI, 빅데이터, 클라우드
  - 머신러닝 → 매우 큰 CPU 파워가 필요하다.
3가지 학습 타입
- 지도학습
  - 인풋+아웃풋 → 결과
  - 데이터가 많고, 정답지도 있다.
  - 정답지를 줬을 때 제일 잘 할 수 있다.
- 비지도학습
  - 정답지가 없다. 데이터는 필요하다.
- 강화학습
  - 데이터도 없고, 정답지도 없다.
  - 정답지를 만들어 낸다.
    - 예시) 알파고
머신러닝
- 데이터, 필요한 데이터 뽑아내기, 트레이닝
- 훈련시키는 것도 인프라이다.
  - 인프라가 튼튼해야 한다.
  - 좋은 인프라에서 빠르게 실행이 되야한다.
- 한 번 돌리고 끝이 아니라 계속 돌려야 한다.
- 입력 데이터 자체를 코드라고 한다.
머신러닝 실패
- 데이터가 많을 때 실패를 많이 한다.
- 데이터가 구분되고 사이즈도 좋아야 한다.
- 머신러닝도 좋은 데이터를 줘야한다.
- 머신러닝이 실패하면 데이터를 의심한다.
  - 좋은 데이터가 아닐 수도 있다.
MLOps
- 데이터가 계속 무한히 반복되어야 한다.
- 예를 들면 쇼핑을 할 때 추천해 주고 클릭하고 구매를 안 했을 때 그 자체를 다시 데이터화 시켜 활용해야 한다.
- 데이터가 데이터를 만들면서 꾸준히 돌아야 한다.
Enterprise ML
- 생산
  - 과정 자체에 ml을 적용할 수 있다.
- 판매
  - ~는 ~가 잘 팔리네 등 사람마다 섬세하게 개인화를 적용할 수 있다.
- 서비스
- 광고
  - 맞춤 광고 등 개인화 적용 가능
ML Industry
- 사용자, 타겟 아이템, 인터럽션, 개인화
  - 이것들이 모아졌을 때 미래 예측이 가능하다.
  - 개인화가 중요하다.
- 시계열 예측
  - 날씨, 물건 등 시간에 따른 변화를 예측한다.
  - 성공 확률이 매우 낮고 어려운 주제이다.
- OCR
  - text, voice, image, video
- NLP
  - 자연어 처리
ML Platform
- mLaaS 사용한다.
- 이제 곧 ml을 사용하는 시기가 온다.
- 중요한건 데이터
  - 중요 데이터를 모으고 정답지를 잘 만드는 것이 중요하다.
ML Platform을 왜 사용하나?
- 서비스가 커졌을 때 mlPlatform이 비용이 절감이 된다.
- ml은 어렵기 때문에 전문에 맡기고 잘 사용하는 법을 익히는 게 좋다.
- ml을 잘 할 필요는 없으나 어느 정도는 알아야 한다.
  - ml을 잘 하는 사람들은 모델러로 수학에 미치고 영어 논문 줄줄이 읽는 사람들이다.
- ml은 결국 서비스에 도움이 되어야 한다.
예시
- 중고마켓
  - 사진도, 설명도 올리는 사람마다 각각이다.
    - Google Vision AI를 사용한다.
  - 추천 ⇒ 개인화
    - 사용, 아이템, 행동정보 등
  - 데이터를 가지고 사람이 할 수 있다 → 머신러닝으로 하면 더 저렴하다.
    - 위 가정이 성립되어야 머신러닝을 쓰는게 옳다.
    - 예시로 이세돌이 50원을 버는데 알파고를 쓴다?(알파고는 비싸다.) 단가가 안 맞는다 이러면 못 쓴다.
- 옷거래
  - 추천, 재고 관리 등 미래 예측이 가능하다.
  - 광고 사업도 한다.
- 테슬라
  - 자동주행
    - 사람, 차, 집 등을 메타버스로 옮겨 머신러닝으로 분리시킨다. ⇒ 데이터를 무제한으로 만든다.
    - 학습이 빠른게 중요해서 회사에서 cpu,gpu를 대체할 칩을 만들었고 이 강력한 칩으로 자동주행을 선도할 가능성이 높다.
    - ML을 잘 활용하고 있다.
- 게임
  - 운영과 생산에 집중을 한다.
  - 저해상도를 고해상도로 바꿔준다.
  - 베타 테스터도 머신러닝으로 가능하다.
  - 캐릭터 목소리나 외관 등 기본 데이터만 잘 가공해서 전달하면 걷는 모션, 때리는 모션, 다른 대사, 개성 등을 부여할 수 있다.
- 데이터
  - 결국 좋은 데이터를 모아야한다.
    - 좋은 데이터란 서비스에 적용을 해서 도움이 되야한다.
추가 질문 답변
- 행동 데이터가 스냅샷 데이터보다 중요하다.
  - 그 사람의 정보가 아니라 이 사람의 행동, 구매했는지, 안 했는지 등
- 머신러닝이 어떻게 그렇게 되나에 대해선 풀어야 할 과제이고 이런 것을 해결해야 수술 등에 적용해 성과를 볼 수 있을 것이다.
ml 관련 없는 질문 답변
- 초기엔 성장할 수 있어야한다.
  - 중요한 역할이 바로 사수이다.
    - 회사 안에서 사수가 없다면 밖에서 찾아라.
    - 회사에 사수가 있어도(내부사수) 밖에서 또 찾아라(외부사수)
- 어떤 점을 보고 개발자를 뽑으시는지?
  - 똑똑한가?
  - 부지런한가? → 믿고 맡길 수 있는지
  - 착한가?
  - 학습 능력이 뛰어나고 프로페셔널하고 착한지를 본다.

'발전소 > 강연 및 세미나' 카테고리의 다른 글

[강연 및 세미나] : 실전 MSA 경험 공유 (2)	2022.05.27
[강연 및 세미나] : 서비스 개발자로 커리어 전환하기 by 와이즐리컴퍼니 현철 CTO (2)	2022.03.24
[강연 및 세미나] : React가 처음인 당신 후기 (0)	2022.02.10
[강연 및 세미나] : 한번 듣고 평생 써먹는 코드 리뷰 노하우 후기 (7)	2022.01.19

노력을 쌓는 개발자 오주현

[강연 및 세미나] : 모두를 위한 ML / Data, ML, Service, and Platform

'발전소 > 강연 및 세미나' 카테고리의 다른 글

댓글

티스토리툴바

[강연 및 세미나] : 모두를 위한 ML / Data, ML, Service, and Platform

'발전소 > 강연 및 세미나' 카테고리의 다른 글

관련글

댓글

티스토리툴바