Python/Python 용어 정리 (12) 썸네일형 리스트형 Python Basic : set.intersection (set 교집합 구하기) intersection intersection은 python의 collection중 하나인 집합을 다루는 set의 교집합을 반환합니다. 아래 예시는 set_1과 set_2의 교집합을 구하는 예시입니다. set_1 = {1, 2, 3, 4, 5} set_2 = {2, 3, 5, 6, 8} print(set_1) print(set_2) x = set_1.intersection(set_2) print(x) - Output {1, 2, 3, 4, 5} {2, 3, 5, 6, 8} {2, 3, 5} set_1과 set_2의 공통 요소인 2, 3, 5만 교집합으로서 반환되었음을 알 수 있습니다. numpy.mean, median, mode 중심경향치(central tendency measures)란? 자료의 중심을 나타내는 숫자 자료 전체를 대표 평균, 중간값, 최빈값 등이 있다 평균 평균(mean): 자료의 합을 자료의 갯수로 나눈 값 다음과 같은 리스트가 있을 때: x = [100, 100, 200, 400, 500] numpy를 이용해 다음과 같이 평균을 구할 수 있다. import numpy numpy.mean(x) 260.0 평균은 극단적인 값(outliers)의 영향을 잘 받는다. 위의 x에서 500 하나를 1700으로 바꾸었을 뿐이지만 전체 평균은 크게 변한다. y = [100, 100, 200, 400, 1700] numpy.mean(y) 500.0 소득처럼 분포가 비대칭적인 경우에도 평균이 자료를 잘 대표하기 어렵다. 사칙.. [Python] 정규 표현식 정리 #1 - 기초 정규 표현식의 기초 . ⇒ 일치하는 모든 문자열 (1개) ^ ⇒ 시작 문자가 일치하는 경우 찾기 $ ⇒ 마지막 문자가 일치하는 경우 찾기 ⇒ 같은 문자열 반복 ⇒ 1개 이상 같은 문자열 반복 ( ) ⇒ 그룹으로 묶기 { } ⇒ 일정 갯수인 패턴 찾기 [ ] ⇒ 여러 문자들 중 1개라도 일치하는지 확인 ? ⇒ 없거나 1개 이상 있을 경우 매치 \문자 : 자주 쓰는 패턴을 나타낼 때 사용 \d : [0-9] \D : [^0-9] (즉, 숫자가 아닌 경우) \s : 공백 문자인 경우 (\t, \n, \r인 경우) \S : 공백 문자가 아닌 경우 \w : [a-zA-Z0-9_] (숫자 및 알파벳 문자인 경우) \W : [^a-zA-Z0-9_] (숫자 및 알파벳 문자가 아닐 경우) 정규 표현식을 사용하기 위한 r.. enumerate( ) 함수 3. enumerate 반복문 사용 시 몇 번째 반복문인지 확인이 필요할 수 있습니다. 이때 사용합니다. 인덱스 번호와 컬렉션의 원소를 tuple형태로 반환합니다. >>> t = [1, 5, 7, 33, 39, 52] >>> for p in enumerate(t): ... print(p) ... (0, 1) (1, 5) (2, 7) (3, 33) (4, 39) (5, 52) tuple형태 반환을 이용하여 아래처럼 활용할 수 있습니다. >>> for i, v in enumerate(t): ... print("index : {}, value: {}".format(i,v)) ... index : 0, value: 1 index : 1, value: 5 index : 2, value: 7 index : 3, v.. 리스트에 map 사용 map은 리스트의 요소를 지정된 함수로 처리해주는 함수입니다 (map은 원본 리스트를 변경하지 않고 새 리스트를 생성합니다). list(map(함수, 리스트)) tuple(map(함수, 튜플)) 예를 들어 실수가 저장된 리스트가 있을 때 이 리스트의 모든 요소를 정수로 변환하려면 어떻게 해야 할까요? 매번 for 반복문으로 반복하면서 요소를 변환하려니 조금 번거롭습니다. 이때는 map을 사용하면 편리합니다. >>> a = [1.2, 2.5, 3.7, 4.6] >>> a = list(map(int, a)) >>> a [1, 2, 3, 4] a = list(map(int, a)) 한 줄로 변환이 끝났습니다. map에 int와 리스트를 넣으면 리스트의 모든 요소를 int를 사용해서 변환합니다. 그다음에 lis.. flatten() 함수 flatten() 함수 flatten은 numpy에서 제공하는 다차원 배열 공간을 1차원으로 평탄화해주는 함수이다. 예시 X = np.array([[51, 55], [14, 19], [0, 4]]) X = X.flatten() # 1차원 배열로 변환 (평탄화) print(X) 결과 [51 55 14 19 0 4] sorted( ) 함수 Python sorted( ) 함수 정리 sorted(정렬할 데이터) sorted(정렬할 데이터, reverse 파라미터) sorted(정렬할 데이터, key 파라미터) sorted(정렬할 데이터, key 파라미터, reverse 파라미터) sorted 함수는 파이썬 내장 함수이다. 첫 번째 매개변수로 들어올 "정렬할 데이터"는 iterable한 데이터 이여야 한다. 첫 번째 매개변수로 들어온 iterable한 데이터를 새로운 정렬된 리스트로 만들어서 반환해 주는 함수이다. 아래 옵션(파라미터)은 다 기본값으로 들어가 있기 때문에, sorted(정렬 데이터)만 넣어도 충분하다. key 옵션 ( key 파라미터 ) key 파라미터는 어떤 것을 기준으로 정렬할 것인지를 결정하는 기준이다. sorted( ~~.. 배열의 축(axis) 이해하기 이전 1 2 다음 1/2