이효건 Hyogun Lee
[Official Profile] [CV]
[Github] [Google Scholar] [Linkedin]
학력
- 학사: 경희대학교 전자공학과
- 석사: 경희대학교 컴퓨터공학과
기술 스택
Bold: Outstanding
- 프로그래밍: Python, Linux shell scripting, C/C++, HTML/CSS/JS
- AI/ML 툴: PyTorch, Lightning/Hydra, mmaction
- MLOps: Linux, Slurm, Ansible, DeepOps, CUDA, Docker, Django
- 말하기: Korean(native), English(proficient, 비즈니스 미팅 가능)
지식
- Video understanding/processing
- Multi-modal Large Language Models (MLLMs)
- Unsupervised Domain Adaptation / Debiasing
- State-Space Models (SSMs)
- Math(algebra, topology, real/functional/fourier analysis, information theory)
관심 주제 (최대한 연구 주제 외적인 것들)
- Long-Term Video Understanding
- Industry에서 긴 비디오 이해에 대한 수요가 높다.
- Short-term에서 잘 되던 것도 long-term 오면 안 되는 것이 많다.
- 무엇보다 프로세싱이 빡세서 진입장벽이 높다. 먹거리가 많다.
- 나는 grounding task를 다루고 있다.
- 이미지나 비디오가 주어졌을 때, 질문에 대한 답을 직접 하는 게 아닌 답을 찾을 수 있는 곳을 짚어주는 문제이다.
- 질문은 자연어 형태("내가 지갑을 어디에 놨지?", "도둑이 언제 들어왔지?", "강아지가 밥을 먹었나?")나 지갑 사진 등의 이미지가 될 수 있고, 답은 timestamp, interval, bbox, 또는 bbox의 시퀀스가 될 수 있다.
- 모델의 답을 사람이 직접 평가하여 믿을지 말지 정할 수 있기 때문에 중요한 문제이다.
- 하지만 일상적인 문제가 아니기에 어렵다.
- 만화 원피스 주인공의 이름이 뭐냐고 물어보면 '루피'라고 쉽게 답하지만, 루피의 이름이 언제 나오는지 물어보면 아무도 답하지 못한다. (몇 번째 화의 몇 분 몇 초 구간에서 이름이 나온다고 대답해야 한다.)
- 항상 정신차려보면 이런 문제들을 풀고 있다.
- TDD for DL
- 내 코드가 언젠가부터 정합성이 깨져 디폴트 세팅으로 돌리는 데도 baseline reproduce가 안 돼서 고생을 몇 주 간 했다.
- 정합성 확인이 가능한 테스트 코드 구현에 투자할 시간이 삽질해서 날리는 시간보다 훨씬 적다는 것을 깨달았다.
- 아직 걸음마 단계지만...신뢰의 가치는 매우 높기에 우선적으로 투자하려고 한다.
- 강아지
- 귀엽고 멍청하고 탐험하는 걸 좋아한다.
- 산책을 해야 평소에 안 다니던 길도 다니게 된다.
- 내가 사는 동네 전체를 화장실로 인지하고 있다.
- 말이 통하지 않기 때문에 최대한 명확한 reward model을 주어 소통해야 한다.
- 가르치면서 배우는 게 많다.
- 수학
- 영어 회화 같은 존재다. 되면 편하고 안 되면 마주칠 때마다 스트레스 받는 물건이다.
- 막상 하면 재밌다. 차원을 확장하며 말도 안 되는 개념들이 생긴다. 내 뇌가 경험한 적 없는 개념들을 접하는 즐거운 경험을 할 수 있다.
- 반대로 확장이라는 행동 자체가 복붙이기에 기초 공사는 항상 반복이다. 그 반복을 또 추상화해놨다. 웃긴 학문이다.
- 현대 수학의 표현들이 optimal 한 것이 아니라는 것을 배웠다.
- 부동산
- 부모님이 부동산을 공부하시면서 항상 가스라이팅 하신다.
- 나도 어느새 동화되어 부동산 이슈가 생기면 여가 시간 투자해서 찾아서 공부하고 있다.
- 부의 추월차선이 소개한 꿈 같은 삶이 있다고 믿지 않는다.
- 하지만 노년에 병원비랑 손주들 용돈은 있었으면 좋겠다는 마음으로 공부하고 있다.
- 운동 및 건강
- 공부는 새로운 개념들을 몸에 익히는 것이다.
- 남을 이해한다는 것은 새로운 개념을 받아들인다는 것이다.
- LoRA는 적게 잊지만 적게 배운다. [1]
- 사람이 여유가 있어야 새로운 걸 배울 수 있다.
- 여유는 체력에서 나온다.
- 정말 하기 싫지만 평균 일주일에 3시간 이상은 투자하고 있다.
연구실 홍보 (자발적으로 씁니다. 당근 없습니다.)
저희 연구실 상당히 자유롭고 많은 걸 배울 수 있습니다. 그리고 프로젝트는 항상 2인 이상 참여를 독려합니다. 처음엔 혼자 하는 게 더 빠르다고 생각할 수 있어도 실수도 금방 잡히고 일 분배 스킬도 생기며, 오히려 나중엔 속도가 많이 붙습니다. 연구실의 탑티어 저자들, 열정 있는 친구들과 교류하며 빠르게 성장하세요. 보석들을 발굴하고자 문(추상적)은 항상 열어놨으니, 연구 주제에 관심이 있다면 교수님께 본인 CV와 함께 인턴 문의 메일 보내보셔요.
노트1: 인턴 채용 문의 메일을 저한테 보내시면 안 됩니다.
노트2: 슬럼 몰라도 됩니다. 알려줍니다.
[1] [LoRA Learns Less and Forgets Less, Biderman et al, 2024] [arXiv]