728x90
반응형
0. 포스팅 목록 & GitHub
(깃허브 스타 버튼 눌러주시면 글 작성에 큰 도움이 됩니다!)
https://github.com/Seokii/Chatbot4Univ
https://seokii.tistory.com/146
이전에 구현했던 여러 클래스와 BotServer 클래스, 멀티 스레드 모듈을 사용해 챗봇 엔진을 완성했습니다.
메인 프로그램이기 때문에 프로젝트의 루트 디렉토리에 파일을 생성했습니다.
1. 챗봇 엔진 서버
# /chatbot.py
import threading
import json
import pandas as pd
import tensorflow as tf
import torch
from utils.BotServer import BotServer
from utils.Preprocess import Preprocess
from utils.FindAnswer import FindAnswer
from models.intent.IntentModel import IntentModel
from train_tools.qna.create_embedding_data import create_embedding_data
# 전처리 객체 생성
p = Preprocess(word2index_dic='./train_tools/dict/chatbot_dict.bin',
userdic='./utils/user_dic.tsv')
print("텍스트 전처리기 로드 완료..")
# 의도 파악 모델
intent = IntentModel(model_name='models/intent/intent_model.h5', preprocess=p)
print("의도 파악 모델 로드 완료..")
#엑셀 파일 로드
df = pd.read_excel('train_tools/qna/train_data.xlsx')
print("엑셀 파일 로드 완료..")
# pt 파일 갱신 및 불러오기
create_embedding_data = create_embedding_data(df=df, preprocess=p)
create_embedding_data.create_pt_file()
embedding_data = torch.load('train_tools/qna/embedding_data.pt')
print("임베딩 pt 파일 갱신 및 로드 완료..")
def to_client(conn, addr):
try:
# 데이터 수신
read = conn.recv(2048) # 수신 데이터가 있을 때까지 블로킹
print('======================')
print('Connection from: %s' % str(addr))
if read is None or not read:
# 클라이언트 연결이 끊어지거나 오류가 있는 경우
print('클라이언트 연결 끊어짐')
exit(0) # 스레드 강제 종료
# json 데이터로 변환
recv_json_data = json.loads(read.decode())
print("데이터 수신 : ", recv_json_data)
query = recv_json_data['Query']
# 의도 파악
intent_pred = intent.predict_class(query)
intent_name = intent.labels[intent_pred]
# 답변 검색
f = FindAnswer(df=df, embedding_data=embedding_data ,preprocess=p)
selected_qes, score, answer, imageUrl, success = f.search(query, intent_name)
send_json_data_str = {
"Query": selected_qes,
"Answer": answer,
"imageUrl": imageUrl,
"Intent": intent_name
}
message = json.dumps(send_json_data_str) # json객체 문자열로 반환
conn.send(message.encode()) # 응답 전송
except Exception as ex:
print(ex)
if __name__ == '__main__':
# 봇 서버 동작
port = 5050
listen = 1000
bot = BotServer(port, listen)
bot.create_sock()
print("bot start..")
while True:
conn, addr = bot.ready_for_client()
client = threading.Thread(target=to_client, args=(
conn, # 클라이언트 연결 소켓
addr, # 클라이언트 연결 주소 정보
))
client.start()
지금까지의 포스팅에서 텍스트 전처리기, 의도 파악 모델, 임베딩 및 pt 파일 생성, 답변 검색 등의 클래스에 대한 구현을 진행했으니 앞쪽 코드에 대한 설명은 따로 하지 않겠습니다.
if __name__ == '__main__':
# 봇 서버 동작
port = 5050
listen = 1000
bot = BotServer(port, listen)
bot.create_sock()
print("bot start..")
while True:
conn, addr = bot.ready_for_client()
client = threading.Thread(target=to_client, args=(
conn, # 클라이언트 연결 소켓
addr, # 클라이언트 연결 주소 정보
))
client.start()
port는 5050, 최대 접속 가능 클라이언트 수는 1000으로 설정했습니다.
프로그램이 동작하면, 무한 루프를 돌며 클라이언트으 연결을 기다리며 수락되면 요청을 처리할 수 있는 스레드를 생성합니다.
이후, to_client() 함수가 실행되며, json 형태의 요청을 받아 올바른 답변 출력까지의 알고리즘을 수행한 후 응답까지 받는 과정이 실행됩니다.
728x90
반응형
'머신러닝 & 딥러닝 > 자연어처리' 카테고리의 다른 글
대학교 AI 질의응답 챗봇 만들기 - 10. 챗봇 엔진 서버 개선하기 (2) | 2022.07.30 |
---|---|
대학교 AI 질의응답 챗봇 만들기 - 9. 챗봇 엔진 서버 테스트 (0) | 2022.07.30 |
대학교 AI 질의응답 챗봇 만들기 - 7. 임베딩 저장 & 답변 검색 클래스화 (0) | 2022.07.30 |
대학교 AI 질의응답 챗봇 만들기 - 6. 소켓 모듈과 JSON (0) | 2022.07.29 |
대학교 AI 질의응답 챗봇 만들기 - 5. 엑셀 내용 임베딩 및 pt파일 저장 & 입력 질문과 유사도 비교(코사인 유사도) (1) | 2022.07.29 |
댓글