본문 바로가기

Projects

UFO 목격 데이터 분석 & 관광지도 제작 프로젝트(come with me) 22.08.26

 

UFO 목격 건수별 시각화 

 

 

시간에 흐름에 따른 UFO 목격 시각화

 

 

이를 기반으로 한 미국 UFO 관광지도

 

https://earth.google.com/web/@33.77522388,-118.15733011,26.63760931a,288114.43778437d,34.99997789y,0h,0t,0r/data=MikKJwolCiExVGNZdFRNZjliX2VVSzZlZ2RiUXJmakh1dnowYWFoZmcgAQ

 

미국 서부 투어 코스 • JUN JIN

 

earth.google.com

 

 

1. Come With Me!
- 주제: UFO 미국관광 투어를 위한 UFO 출몰지역 및 패턴데이터 분석
- 4조: 진OO, 문OO, 안OO, 정OO, 최OO
- 2022. 08. 26. Fri

 

2. 분석 동기 및 분석 목표
- 미니프로젝트인 만큼 일반 대중들의 관심을 끌 만한 재미있는 주제 선택

- UFO 목격 데이터가 있는 사이트를 찾은 후 웹 크롤링

- 2000~2022년까지의 데이터 활용

- ‘UFO 미국관광 투어를 위한 UFO 출몰지역 및 패턴데이터 분석을 목표로 결정

 

3. 데이터 수집
- National UFO Reporting Center 웹사이트의 Data Bank-Index by EVENT DATE 부분

https://nuforc.org/

 

National UFO Reporting Center

The National UFO Reporting Center receives, corroborates, and posts reports from individuals who have witnessed unusual, possibly UFO-related events from around the globe.

nuforc.org

- 수집방법: 크롬 확장도구 'Instant Data Scraper'로 웹 크롤링

- 수집 구간: 20001~ 20226

- 최종 로우데이터 수 119,625개 중 미국(USA) 데이터 85,506

- 11개의 컬럼 중 필요없는 부분 삭제 후 총 7개의 컬럼을 활용하기로 함

- 목격일시/목격도시/미국주코드/국가/UFO 모양/목격상황 요약/출몰듀레이션(초 단위)

 

 

4. 전체 데이터의 컬럼명 변경

 

- Null 값 처리

- ‘목격일시 컬럼 형식을 object에서 Datetime으로 변환

- Datetime의 컬럼이 float 형식으로 나와서 다시 int 형식으로 변환

- ‘duration’ 컬럼을 정리하여 duration.csv로 저장 후 엑셀 전처리 시작

- 엑셀 -> R -> Python3단계를 거치며 ‘duration’ 컬럼 전처리 진행

찾아서 모두바꾸기로 분석에 필요 없는 문자열 1차 제거 (each, approx, about 35)

그중 처리불가인 16개 문자열 및 특수기호는 수량이 크지 않아 드롭시킴 (~, ?, +/ )

호환 문제로 밀린 셀 다시 정리

 

 

5. 데이터 분석 및 시각화

 

 

연도별 UFO Sighting Counting

 

월별 UFO Sighting Counting

 

 

 

월별 UFO Sighting Counting: 월별 기온+목격 건수와의 상관관계 분석

 

 

동부의 뉴욕 주와 서부의 캘리포니아의 월별 목격 건수와 기온에서 약한 양의 상관관계가 있는 것을 볼 수 있다.

그래서 월별 시각화의 결과에 부합하는 상관관계가 있음을 알 수 있다.

 

 

일별 UFO Sighting Counting

 

 

 

요일별 UFO Sighting Counting

 

 

 

시간별 UFO Sighting Counting

 

 

 

지역별(state) Top 5 UFO Sighting Counting

 

 

 

 

목격담 WordCloud 분석 – California

 

 

 

 

 

모양별(shape) Top 5 UFO Sighting Counting

 

 

 

목격 모양 WordCloud 분석 – Light Shape

 

 

 

목격 듀레이션(shape) 분석

 

 

 

 

 

 

목격 듀레이션(시간) 분석

 

결론

 

이러한 목격 데이터를 바탕으로

7월, 4일, 토요일, 21:00, 켈리포니아 지역, 빛모양, 5초 라는

UFO 목격 데이터가 가장 보고가 많이 된 데이터임을 알 수 있었다.

 

또한 우리는 이와 같은 목격데이터를 이용하여, 맨 위에 보여준것과 같은 UFO 관광지도를 제작하였다.

목격담에 UFO목격지점이 주소로만 적혀있고, 위도 경도로 매핑이 되어있지 않아, Geopy 라이브러리를 이용하여 

위도 경도로 매핑하였다.

 

 

UFO 목격 건수별 시각화 

 

 

시간에 흐름에 따른 UFO 목격 시각화

 

 

이를 기반으로 한 미국 UFO 관광지도

 

https://earth.google.com/web/@33.77522388,-118.15733011,26.63760931a,288114.43778437d,34.99997789y,0h,0t,0r/data=MikKJwolCiExVGNZdFRNZjliX2VVSzZlZ2RiUXJmakh1dnowYWFoZmcgAQ

 

미국 서부 투어 코스 • JUN JIN

 

earth.google.com