인공지능과 데이터
머신러닝과 데이터 사이언스
[박정현의 데이터사이언스 시작하기] ⓛ데이터사이언스, 머신러닝 그리고 인공지능
데이터 과학 대 인공 지능- 분야 간의 차이점 - AWS
머신러닝이란?
프로세스
- 문제정의 - 문제를 명확히 정의해야한다
- 데이터 수집 - 어떤 데이터를 모을지 명확히 하고 개발한다.
- 모델훈련 - 모델의 타입과 훈련 그리고 데이터의 전처리
- 평가 - 모델에 대한 평가뿐만 아니라 비지니스 측면에서, 연구 측면에서의 전체적 평가
- 분석 - 평가를 만족하지 못했을 경우
- 배포 - 평가를 만족한 경우
데이터 직군별 역량
- 이들은 서로 함께가기에 커뮤니티 기술이 가장중요
- 특히, 사람 이외에 인공지능과의 커뮤니티 기술도 중요
비즈니스 분석가
- 데이터 분석 도구
- Tablo, Pandas
- 통계적인 부분
데이터 엔지니어
- 대용량 데이터를 다뤄야함
- 하둡(Hadoop)
- 클라우드 엔지니어링(Cloud Engineering)
- 파이프 라인 구축
- Airflow
데이터 과학자 / AI/ML 연구원
- 논문 읽고, 구현능력
- 딥러닝 프레임워크
- 파이토치
- 텐서플로우
- 머신러닝 프레임워크
- LLM 관심 있으면
- Hugging face
- Langchain
AI/ML 엔지니어
- 실제 개발 할 수 있는 능력
- Testcase 작성
- Architecture
효과적 학습 방법
- 살펴보기 with GPT
- 공식문서 읽기 with GPT
GPT 사용법
-
페르소나 적용
-
목차를 만넣고 설명해달라 하기
-
문제 만들어 달라고 한뒤 풀어보기
프롬프트 엔지니어링 미래?
- 단순히 질문 주고 받고 하는게 아니라
- 그것을 자동화 할 수 있는 프로그래밍을 만드는것