2021/09/22 4

캐글(Kaggle) Notebook 실습(Exercise)하는 방법

캐글에서 Courses를 선택해 수강하고, 강의 글을 읽은 뒤에 코드 실습을 하라고 합니다. 이 때, 목록에 있는 Exercise의 버튼을 클릭하거나 팝업으로 뜨는 Your turn 아래의 "Start Exercise"를 클릭하거나 아니면 글 아래에 있는 링크를 따라가면 kaggle notebook으로 연결이 됩니다. (아예 내비게이션 바에서 Code탭을 선택 후에 접근할 수 도 있지만, Courses 실습 환경이라고 가정했으니..) 기본적으로 jupyter notebook을 사용해보셨다면, 어렵지 않게 적응하실 수 있으나 혹시 처음 보시는 분들을 위해 적어보자면... 메인이 되는 화면 중앙의 패널이 노트북이고 여기에는 마크다운과 코드 2가지 블록을 삽입할 수 있습니다. 현재 보이는 화면 또한 캐..

STUDY LOG/Kaggle 2021.09.22

Intro to Machine Learning(2)

기본 데이터 탐험 데이터를 불러오고 이해하기 Pandas를 이용하여 데이터와 친해지기 어떤 기계학습 프로젝트든지 당신 스스로가 데이터와 친해지는 것이 첫걸음입니다. 당신은 이를 위해 Pandas 라이브러리를 사용할 것입니다. Pandas는 데이터 사이언티스트들이 데이터를 찾고 능수능란하게 다루기 위해 사용하는 주요 툴입니다. 대부분 코드에서 Pandas를 줄여서 pd라고 표현합니다. 이것을 아래와 같이 명령할 수 있습니다. import pandas as pd Pandas 라이브러리의 가장 중요한 부분은 바로 데이터프레임(DataFrame)입니다. 데이터프레임은 대체로 당신이 표(table)라고 생각하는 데이터 타입을 가집니다. 이것은 엑셀의 sheet나 SQL 데이터베이스의 table과 비슷합니다. Pa..

STUDY LOG/Kaggle 2021.09.22

Intro to Machine Learning(1)

모델은 어떻게 작동하는가? 먼저, 기계학습 모델이 어떻게 작동되고 어떻게 사용되는지 알아보는 것부터 시작하겠습니다. 이미 좀 배웠다면 좀 시시할테지만, 곧 파워풀한 모델을 만들것이니 일단 들어보죠. 당신의 친척이 부동산으로 수백만 달러를 벌었습니다. 그는 당신의 데이터 사이언스에 대한 관심을 보고 비즈니스 파트너가 되달라고 오퍼를 했습니다. 그는 돈을 제공할 것이고 당신은 다양한 주택들의 가치를 예측하는 모델을 제공할 것입니다. 당신은 그에게 과거의 그가 부동산의 가치를 어떻게 예상했는지를 물어봤고, 그는 그저 직감이라고 답했습니다. 하지만 더 많은 질문들을 통해 그가 과거에 주택 가격의 패턴을 알아냈고, 그 패턴을 그가 고려 중인 새로운 주택을 예측하는 데에 사용한 것을 알 수 있었습니다. 기계학습은 ..

STUDY LOG/Kaggle 2021.09.22

캐글(Kaggle) 등급 알아보기

캐글에는 Progression System이 존재한다. 쉽게 생각하면 캐글에서 매기는 전문가 등급이라고 봐도 될 것 같다. 등급을 매기는 분야는 Competitions, Notebooks, Datasets, Discussion 이렇게 총 4가지가 있다. 그리고, 각각의 분야에서 얻을 수 있는 등급은 밑에서부터 Novice, Contributor, Expert, Master, Grandmaster 이렇게 5가지 등급이 존재한다. 먼저, Novice 등급은 써있는대로 가입만하면 주어지는 기본 등급이다. 더 설명할 것은 없는 것 같다. 다음으로 Contributor 등급은 위에 나와있듯 4가지 조건이 필요하다. - 1번 이상 notebook이나 script를 실행 - 1번 이상 competition이나 tas..

STUDY LOG/Kaggle 2021.09.22