본문 바로가기
728x90
반응형

lean/주간 회고71

23.10.08~23.10.15 업무 1. 온보딩 요소 제어 로직 작성 사용자가 입력한 온보딩 관련 데이터를 생성 및 제어하는 기능을 개발했다. 1) 특정 요소 생성 모듈 작성 처음에는 각 컴포넌트 요소(툴팁 등)들을 builder 패턴을 사용해 작성했었다. 왜? → 해당 요소를 생성하기 위한 단계가 나뉘어 있었기 때문에(루트 element 생성, 스타일 적용, 이벤트 적용 등), 각 단계를 사용처에서 호출해 객체를 생성할 수 있도록 의도했기 때문! → 코드의 직관성을 높이고, 전체 데이터 인터페이스에 의존하는 게 아니라 각 단계에서 필요한 값을 주입받길 원했다. 그런데 점차 개발을 하다보니, 각 요소를 생성하는 시점은 크게 단계가 나뉠 이유가 없어 보였다. + 어차피 모든 단계에서 해당 데이터 인터페이스 전체가 필요해, 오히려 특정 .. 2023. 10. 16.
23.10.01~23.10.08 업무 1. 신규 서비스 개발사항 리팩토링 추석 연휴가 시작되기 직전, 신규 서비스 MVP를 개발했었다. 기획-디자인이 명확하게 나오지는 않은 상태라, 전체적인 동작만 확인했었는데... 의도대로 구현은 됐지만, 작성한 구조와 코드가 도무지 맘에 들지 않았다. 개선이 필요했던 이유는 1. 각 Class 들이 명확하게 추상화되지 않아 이해가 어려웠고 2. 불필요한 결합도로 인해 유지보수 및 확장이 어려웠기 때문! 추석 내내 어떻하면 이를 개선할 수 있을지 고민했고, 출근 후 하루 정도 시간을 내 리팩토링을 진행할 수 있었다! 1. 시나리오 관리자 추상화 각 시나리오에 맞는 HTMLElement를 DOM에 그려줘야 했는데, 이전에는 시나리오 관리자라는 객체에서 1) 해당 시나리오에 맞는 HTMLElement를 .. 2023. 10. 8.
23.09.17~23.09.24 업무 1. 신규 서비스 관련 기능 개발 회사에서 새로 개발하는 mvp 관련 기능 개발을 진행했다. 사용자의 웹 페이지에 접근해 DOM을 조작하고, script를 삽입해 데이터를 불러오는 등 기존 서비스 개발과는 다른, 새로운 형태의 요구 사항을 구현해야 했다. 각 요구 사항을 직접적으로 개발해본 팀원이 한 명도 없었기 때문에, 우선 한 사이클을 돌리는 데 집중한 한 주! 1) chrome extension을 통한 HTML 조작 https://www.youtube.com/watch?v=GF_3kGzJpCA 이전에 감명 깊게 본 컨퍼런스. 크롬 익스텐션을 활용해 빠르게 프로토타입을 만들고, 실제 유저 환경에서 테스트하는 모습이 인상적이었다. 마침 이번 서비스도 익스텐션을 통해 사용자의 웹 사이트를 조작해야 .. 2023. 9. 24.
23.09.10~23.09.17 업무 1. R&D 연구 과제 수행 1) 변경된 단어 사전 반영 연구 과제를 진행하면서, 단어 사전 구축의 중요도를 뼈저리게 느꼈다. 하지만 한 사이클을 돌려보는 게 무엇보다 시급하다고 판단, 해당 작업은 상대적으로 느슨하게 진행한 채 넘어갔었다. (데이터 하나하나에 대한 라벨링을 손수 해줘야 한다는 점에서... 시간도 오래 걸리고, 나중에 작업해도 별 차이는 없을 거란 판단) 그리고... 그 나중에 를 이번 주에 겪었다. 하하! 단어 사전 구축 자체는 팀원 한 명이 전담해 진행했는데, 이번 주에 완료가 되었다. 단어 사전이 변경됨에 따라, 해당 사전을 참고하고 있는 언어 모델의 결괏값이 바뀌었고, 언어 모델의 결과값을 기반으로 작성된 알고리즘 역시 수정되어야만 했다. 사실 해당 결과값이 수정되리라는 건 .. 2023. 9. 17.
23.09.03~23.09.10 업무 1. R&D 연구 과제 수행 1) 결과 도출 알고리즘 작성 지난주 작성하던 결과 도출 알고리즘을 이어서 개발했다. 기본적인 로직 자체를 얼추 구현된 상태라서, 리팩토링 및 성능 향상에 초점을 맞췄다. y 데이터의 라벨이 6개밖에 없는 상황이라 미용샵 데이터 매칭이 어렵진 않을 거라 생각했는데... 비정형 데이터(자연어)이다보니 예상보다 많은 예외 상황이 존재했었고, 이를 커버하는 것에 주된 시간을 쏟았던 것 같다. 회고 정말 오랜만에 휴가를 다녀왔다. 그것도 이틀이나! 항상 휴가를 다녀오면... 약간의 여유나 환기가 됐었는데, 이번에는 딱히 그런 기분을 느끼지 못했다. 오히려 휴가 후 다시 책상 앞에 앉았을 때 → 할 일들 때문에 더 조급함을 느꼈달까. 회사 업무 + 개발 공부 + 정보처리기사 시험.. 2023. 9. 12.
23.08.27~23.09.03 업무 1. R&D 연구 과제 수행 역시나 팁스 연구 과제를 수행했다. 1) bert 모델 전이 학습 bert 모델을 통한 분류 모델 학습을 시도했었는데, 정확도가 (드디어) 70%대가 되었다! 어째서 이런 일이 일어났는고 하니... 이전 bert 모델은 사전 학습된 데이터가 하나도 없는, 말 그대로 깡통 모델에 불과했다. 즉 우리가 입력한 학습 데이터 이외에는 아무 것도 학습되지 않았었는데... 문제는 한국어 문장조차 학습이 이뤄지지 않다보니, 자연어로 이뤄진 데이터셋의 학습이 원할하게 이뤄지지 않았던 것. 따라서 klue/roberta-base, klue/bert-base 등 bert 모델을 학습시킨 모델을 사용한 전이 학습을 진행했고, https://huggingface.co/docs/transfor.. 2023. 9. 6.
23.08.20~23.08.27 업무 1. R&D 연구 과제 수행 지난주와 마찬가지로, 팁스 연구 과제를 수행했다. 1) 분류 모델 fine tuning 지난주부터 multiclass classsification을 위해 여러 머신 러닝 모델들을 연구했었다. 그중 gpt를 분류 모델로써 사용하기 위해, fine tuning을 거쳤는데... 지난주 위 회고에 적었던 내용이 적중! 제외했던 feature를 학습 데이터셋에 추가하자, 정확도가 크게 증가한 모습을 확인할 수 있었다. 그렇게 희망적인 주 초반을 보냈는데... 곧 벽에 부딪히고 말았다. 다른 한 팀원은 동일한 데이터 셋으로, lightGBM을 통한 분류 학습을 진행했다. Word2 Vec와Kobert를 사용한 word embeding을 통해 자연어 데이터를 벡터화한 후 lightG.. 2023. 8. 27.
23.08.13~23.08.20 업무 1. R&D 과제 수행 기술 연구 과제를 수행했다. 1) 학습 데이터 생성 현재 약 30만 개의 반려 동물 미용 예약 데이터를 보유 중이다. 이를 분류 모델의 학습에 필요한 데이터로 변환했다. 그중 처음부터 정형화된 형태로 수집된 데이터는 아무런 문제가 없었지만... 운영 중인 서비스 및 도메인 특성상 그러지 못한 데이터 들도 많았고, 따라서 이들을 학습 데이터 형태에 맞게 일일이 변환하는 과정을 거쳐야만 했다. 그 과정에서 굉장히 아쉬웠던 점 → 팀 내부에 도메인 전문가가 없다는 사실! 물론 개발자인 나도, 팀원들도 약 3년 정도 해당 도메인에서 서비스를 운영했기 때문에, 기본적인 도메인 지식은 보유한 상태였다. 하지만 해당 도메인에 속한 전문가만큼은 (당연히) 알지 못하는 게 사실이었고, 학습 .. 2023. 8. 20.
23.08.06~23.08.13 업무 1. R&D 과제 수행 틈틈이 진행하던 R&D 과제를 이번 주 통으로 시간을 내 진행했다. 자세한 내용을 작성할 순 없지만... 1) 학습 데이터 생성을 위한 데이터 전처리 2) 한국어 형태소 분석 위 두 가지가 주된 업무였다. 1) 데이터 전처리 언어 모델이 학습할 데이터를 위해, 도메인과 관련된 단어 사전을 구축해야 했고, 이를 위한 데이터 전처리를 진행했는데... 말이 좋아 전처리지, 사실상 기존 데이터를 단어 사전과 일일이 매핑하는, 수작업 노동에 가까운 일이었다! 모델 학습을 위해 반드시 거쳐야 하는 과정임을 알곤 있지만, 눈이 침침... 목이 뻐근... 한건 어쩔 수 없던 일. 하하! 2) 한국어 형태소 분석 자연어 형태의 문장에서 유의미한 값을 얻어내야 했고, 이를 위해 한국어 형태소 .. 2023. 8. 16.
728x90
반응형