PAILAB KEM KIM

목차

1. KEM KIM 분석 과정

1. 데이터 로딩

분석의 첫 단계로, CSV 파일에서 텍스트 데이터를 불러옵니다. 이 데이터는 데이터의 텍스트와 각 문서의 날짜 정보로 구성됩니다.

2. 데이터 전처리

불러온 데이터를 분석에 적합한 형태로 변환하고, 그룹화하는 과정입니다. 이 단계에서는 다음과 같은 작업이 이루어집니다:

3. 키워드 추출

텍스트 데이터에서 빈도가 높은 단어들을 추출하여 키워드로 지정합니다. 이 과정에서 다음 작업이 포함됩니다:

4. 분석

각 기간별로 키워드의 중요성을 분석합니다. 주요 분석 단계는 다음과 같습니다:

5. 시각화 및 데이터 저장

분석된 데이터를 그래프로 시각화하고, 결과를 다양한 형식으로 저장합니다. 주요 단계는 다음과 같습니다:




2. MANAGER KEM KIM 연산 절차

1. 추적 데이터 생성

전체 KEM KIM 분석 기간에 대해서 미시적 분석을 진행합니다. 예를 들어 2010~2024년 기간의 KEM KIM 분석 시, (2010~2011), (2011~2012), ... , (2023~2024)의 KEM KIM 분석을 통해 키워드별로 기간을 따라 신호 변화를 추적합니다. 이 과정은 각 키워드의 시계열적 시그널 변화를 파악하는 데 중점을 둡니다:

2. 시그널 필터링 및 좌표 데이터 업데이트

추적된 데이터에서 시계 방향으로 Signal 이동이 일어나지 않은 키워드를 걸러내고, 해당 키워드 제외 사전에 추가합니다:

3. 최종 결과물 생성 및 저장

최종적으로 필터링된 데이터를 기반으로 KEM KIM 분석 결과를 생성하고, 결과를 저장합니다:

1. 최상위 폴더: kemkim_folder_path

최종 분석 결과가 저장되는 최상위 폴더로, 폴더명은 분석 대상 CSV 파일 이름과 분석 기간, 분석 시간에 기반하여 생성됩니다.

2. Data 폴더

주기별로 계산된 TF, DF, DoV, DoD 데이터를 저장합니다.

3. Result 폴더

최종 분석 결과와 시각화 자료를 저장합니다.

4. Trace 폴더

추적 분석을 위한 중간 결과와 최종 결과를 저장합니다.

중요 사항

데이터 양: 데이터의 양(Period의 수)이 많을 경우, 분석 시간이 길어질 수 있습니다. 이 과정에서 프로그램이 응답하지 않는 것처럼 보일 수 있으나, 이는 정상적인 동작입니다.

제외 단어: 분석에서 제외할 단어들을 지정할 수 있으며, 이들은 필터링된 단어와 함께filtered_words.csv 파일에 기록됩니다. 이는 분석의 정확성을 높이기 위한 과정입니다.

결과 해석: 최종 결과는 키워드의 등장 빈도와 시간에 따른 중요성 변화를 나타냅니다. 이를 통해 특정 키워드가 특정 기간에 급격히 Signal 중요도가 높아졌다면, 해당 기간에 관련된 중요한 사건이 있었음을 추정할 수 있습니다.