본문 바로가기

개발

(68)
코랩(Colab) 노트북 전체 페이지 html 파일로 저장하기 주피터 노트북에는 html 저장 기능이 있는 것 같은데, 코랩에서는 안 보여서 찾아보니 Save Page WE 플러그인을 사용하면 된다. Save Page WE Save a complete web page (as curently displayed) as a single HTML file that can be opened in any browser. chrome.google.com 설치하면 상단 플러그인 창에 아이콘이 뜨는데, 눌러주면 전체 페이지가 html로 저장된다. 검색해보니 plotly는 예전에는 코랩에 그냥 보이지도 않았던 모양이다...! 이제는 잘 보이지만, 외부 공유시나 깃헙에 올릴 시 코드만 보이고 plotly 그래프는 보이지 않는다. 주피터 노트북에서 작업한 파일도 마찬가지다. 그래도 슬슬..
IMDb 인물 정보로 성별 구별하기 이번에 분석하는 영화 데이터에서, 감독과 제작자, 각본가의 성별 정보를 넣고 싶어 검색해본 결과, U.S. movies with gender-disambiguated actors, directors, and producers For producers and directors that do not also have acting credits, we use indirect methods to assign a gender. If present, we parse the individual's biographical text for gender-specific pronouns (he/his/him/himself, or she/her/hers/herself). If the number of (male-) femal..
구글 코랩(Colab)에서 json 파일 열기 json 파일은 어떻게 여는 건지, 파이참으로 열면 이렇게 뭔 암호같은 딕셔너리만 가득해서 무서웠는데.. ㅋㅋㅋ 사실 별 거 아니었다! 이 포스팅에서는 구글 드라이브에 마운트하는 방법을 다루지만, 그냥 런타임에 올리고 똑같이 해도 된다. 먼저 구글 드라이브 내에 폴더를 새로 파서, json 파일을 넣어준다. from google.colab import drive drive.mount('/content/drive') 구글 드라이브에 마운트 해 주고, # 파일 넣어둔 폴더로 이동 % cd /content/drive/본인경로 파일을 넣어둔 구글 드라이브 폴더 경로를 넣어준다. (해당 폴더로 경로 이동) (생략 가능 : 파일 미리보기) # json 파일 프린트 from glob import glob for fi..
코랩 Colab 폰트 맞춤설정하는 방법 윈도우 os 기준, 코랩 영문 폰트가 가독성이 좀 떨어지고, 브라우저 폰트를 리디바탕으로 바꿨더니 코딩할 때는 뭔가 가독성이 불편한 느낌이라 결국 코펍바탕프로로 다시 돌아왔다,, ^^... 결과물. 영문 폰트는 JetBrains Mono가 좋은 거 같다. 파이참 설치하면 뜨는 기본 폰트다. 코랩 내의 마크다운, 데이터 프레임의 폰트는 Sans-serif를 바꾸면 되고, 코랩 셀 내의 폰트는 고정폭 글꼴을 바꾸면 적용된다. 웨일 브라우저 기준 whale://settings/fonts 크롬 브라우저 기준 chrome://settings/fonts 에서 바꿀 수 있다.
f-string : 파이썬에서 문자열에 변수 넣어주기 반복문을 돌리다 보면 헷갈려서 문자열에 변수명을 넣어주고 싶을 때가 있다. 파이썬에서 %s, {}.format() 의 방법도 있지만 파이썬 3.6부터 지원되는 f-string이 가장 속도가 빠르다고 한다. 내가 보기엔 코드 알아보기도 제일 쉬운 것 같다. 방법은 for var in list: print(f'변수를 {var}에 넣어보자') 앞에 f를 붙이고 ''로 감싼 뒤, {} 안에 변수를 넣어주면 된다. 변수가 여러 개일 때도 잘 동작한다. a = 금요일 b = 월요일 f'오늘은 {b}이니까 빨리 {a}가 왔으면 좋겠다' 만약 소수점 자리수를 조정하고 싶다면, :.nf 를 넣으면 된다. (n자리에 원하는 자릿수를 넣어주자) a = 3.14159265358979323846 print(f'{a:.3f}를 ..
리디셀렉트 - 데이터 분석가의 숫자유감 select.ridibooks.com/article/@data/4?q=%EB%8D%B0%EC%9D%B4%ED%84%B0&s=search 확률과 분포 | 그 때는 맞고 지금은 틀린…가? - 리디셀렉트 데이터분석가의 숫자유감 select.ridibooks.com 확률과 통계에 대한 개념을 이해하기 쉽게 만화로 연재한다. 아래는 연재된 내용 중 필사한 내용이다. 상관관계가 있다고 인과관계가 있는 건 아니다. 두 데이터가 비슷할 때 유의미한 차이가 있는지 확인하기 위해서 사용하는 게 test다. 모집단은 간단해 보이지만 매우 추상적인 개념이다. 간단히 정의할 수 없다. 모집단의 데이터 분석을 하려면 1. 모집단을 어느 정도 정의 2. 이에 가까운 표본을 정의(큰 수의 법칙을 사용해서 모집단의 특성치를 추정하기에..
Enumerate 함수 enumerate는 '열거하다' 라는 뜻이다. 객체에 번호를 매겨 enumerate object로 만들어준다. for loop에 직접적으로 사용하거나 list() 메소드를 사용하여 리스트 형태로 만들 수 있다. l1 = ["cat","dog","repeat"] #list s1 = "cat" #string # creating enumerate objects obj1 = enumerate(l1) obj2 = enumerate(s1) print ("Return type:",type(obj1)) # Return type: print (list(enumerate(l1))) #[(0, 'cat'), (1, 'dog'), (2, 'repeat')] print (list(enumerate(s1))) # [(0, 'c'..
파이썬 =, == 차이 =는 대입 연산자이다. Assign Operator. a = 100 b = 100 같이 변수에 값을 할당해줄 때 쓴다. ==는 비교 연산자이다 a == b a와 b의 값이 같은가? >>> False a !=b a와 b의 값이 같지 않은가? >>> True. print( a = b ) >>> 오류 발생. =는 b의 값을 a에 대입하기 위한 연산자이지 둘이 같냐고 비교하는 연산자가 아니다.