Project

특정 도메인 임베딩 학습에 도움이 되는 Domain BERT 중에서, 의학 분야에 관련된 ClinicalBERT, BioBERT, BlueBERT를 간단하게 정리해보았다. ✅ ClinicalBERT📍개요임상 기록과 같은 의료 도메인에서의 자연어 처리(NLP) 성능을 높이기 위해 개발된 모델이다. BERT의 기본 구조를 유지하되, 의료 데이터셋에 특화된 전처리와 추가 학습을 통해 의료 도메인에 맞춤화되었다.📍특징전자 건강 기록(Electronic Health Records, EHR) 데이터를 포함한 임상 텍스트로 추가 학습된 모델으로, 임상 기록의 독특한 구조와 문맥을 이해할 수 있도록 설계되어 의료 용어와 문맥을 효과적으로 처리할 수 있는 능력을 제공한다.BERT와 동일한 트랜스포머 기반의 구조를 가..
아무도 메디컬 코딩 관련 프로젝트를 안했나보다...맨 땅에 헤딩 GABOZAGO✅ 내가 수행할 Medical Coding(메디컬 코딩)📍개요임상시험에서 Medical coding은 임상데이터를 표준화된 용어로 변환하는 과정이다. 즉, 환자의 진료 기록, 진단, 치료 절차 등을 ICD, CPT, HCPCS, MedDRA 등등 특정 코드로 변환하는 것을 뜻한다. 원래는 DM이나 임상시험 기관이 직접 Medical coding을 수행한다고 하는데...! 그래서 Medical coder라는 직업도 있다고한다. 근데 사람이 다 하기는 한계가 있으니까 Medical coding AI를 만드는 추세이다.나는 Medical History, Adverse Events는 MedDRA 데이터로! Concomitant Me..
내가 보유한 작고 소중한 주식 테슬라, 현대자동차, 삼성전자의 주식을 LSTM을 이용해 예측해보겠다.제발...제발...오르게해주세요...간절한 염원을 담아 고고씽✅ LSTM이란?LSTM (Long Short Term Memory)은 기존의 RNN에서 출력과 멀리 있는 정보를 기억할 수 없다는 단점을 보완하여 장/단기 기억을 가능하게 설계한 신경망의 구조이다. 주로 시계열 처리나, 자연어 처리에 사용된다.​구조 1) 입력 게이트 : 새로운 정보의 반영 방법 결정 -- 시그모이드 함수, 탄젠트 함수 2) 망각 게이트 : 셀 상태의 정보를 지울 것인지 말 것인지 결정 3) 출력 게이트 : cell state 값에 함수를 적용한 값을 사용 4) Cell state : 이전 상태에서 현재 상태까지 유지되는 정..
2022년 야구에 입덕한 야린이의 사심 가득 프로젝트 시작합니다.​일단 주제 후보를 여러개 생각해보았는데1. 선수 부상률 예측2. 연봉 예측3. 승부예측(승패 예측)4. 유망주(신인, 2군 선수 등)의 1군 성공 예측​네개 다 해보고 싶지만 몸은 하나고,,,2,3번은 이미 누군가가 했던 흔적들이 있고 1번은 너무 마음 아파서...그리고 야덕의 심장을 뛰게 하는 것은 잘치는 타자와 잘던지는 에이스 투수도 있지만 뭐니뭐니해도 자라나는 새싹들...유망주라는 생각에...! 4번으로 결정!!​그래서 주제는??????????KBO 유망주들의 KBO 1군 성공 예측고교야구 선수들도 포함할지는 아직 미지수이다​그럼 데이터를 가져와보자. ✅ 데이터 크롤링 1. KBO 기록실https://www.koreabaseball...
jamjamjami
'Project' 카테고리의 글 목록