STORY
MinJ is_

프로젝트 17

2024 하나은행 상반기 디지털 최종합격 후기

안녕하세요! 오늘은 2024년도 상반기 하나은행 디지털 최종합격 후기에 대해 작성해보려고 합니다 ㅎㅎ 저는 인공지능과 빅데이터 분야를 공부하던 학생으로 디지털 부문에 지원했습니다. 1️⃣ 서류/필기저는 하나 디지털 파워 온 프로젝트 1기에서 수상을 한 경험이 있어서 서류와 필기는 면제였습니다!! 동기분들의 후기를 들어보니, 이번 코딩테스트에서 sql 문제가 어려웠다고 했습니다! 다들 보통 sql을 빨리 풀고 알고리즘을 푸는데, 처음에 막혀다고 하더라구요. 참고로 하나 디지털 파워 온 프로젝트 3기가 현재 모집 중이니 관심 있으신 분들은 참여하시면 좋을 것 같습니다! 디지털과 금융을 융합한 프로젝트를 실무 멘토님들과 해볼 수 있는 정말 좋은 기회였습니다 :) 수상하게 된다면 서류와 필기 면제 기회도 제공됩..

2023년 2024.06.02

[알라딘&한국장애인재단] 지니서포터즈 활동 후기

항상 해보고 싶었던 낭독 봉사를 드디어 올해 해보게 되었습니다 ㅎㅎ 제가 이번에 참여한 대외활동은 알라딘과 한국장애인재단이 주관한 "지니 서포터즈"입니다! 지니 서포터즈는 시각 장애인을 위한 녹음도서를 제작하는 봉사 대외활동입니다. 1기의 경쟁률이 7~8:1이었다는 후기를 보고, 기대를 하지 않았는데 감사하게도 합격해 좋은 경험을 할 수 있었습니다. 전체적인 후기를 포스팅해보겠습니다~! 1차 낭독 교육 ♥️ 선물 대외활동이 시작한 후, 바로 1차 낭독 교육을 받았습니다. 교육장소로 가자, 각자의 자리에 마실 것과 선물이 놓여져 있었어요 ㅎㅎ 선물 구성은 아래 사진 처럼, 컵, 수첩, 펜 등이 있었습니다! 스누피 너무 귀엽지 않나요 ㅎㅎ 컵 디자인도 귀여워서 집에서 저의 최애 컵으로 잘 사용 중입니다 ㅎㅎ..

2023년 2023.11.30

[12주차] 추가공부

# 오늘 코드 - 조은 강사님과 함께하는 수업💖 # 12주차 동안 진행한 3일의 수업 중 더 공부해보고싶거나 복습해보고 싶었던 내용 정리입니다. CNN 모델 전이학습(Transfer Learning)이란? 사전적 정의 한 분야의 문제를 해결하기 위해서 얻은 지식과 정보를 다른 문제를 푸는데 사용하는 방식 CNN에서의 전이학습 '이미지 분류' 문제를 해결하는데 사용했던 네트워크를 다른 데이터셋 혹은 다른 문제에 적용시켜 푸는 것 💡 다양한 이미지의 보편적인 특징 혹은 피처(Feature)들을 학습했기 때문에 전이학습을 수행하지 않은 모델들보다 비교적 빠르고 정확한 정확도를 달성할 수 있음 ! 😊 아래에서 전이학습에 사용될 수 있는 유명 CNN 모델에 대해 알아보자 ! ◆ LeNet CNN을 처음으로 개발한..

[10주차] 추가공부

# 오늘 코드 - 조은 강사님과 함께하는 수업💖 # 10주차 동안 진행한 3일의 수업 중 더 공부해보고싶거나 복습해보고 싶었던 내용 정리입니다. Object Detection 성능 평가 지표 Object Detection (물체 검출) 이란? 입력 영상이 주어질 때, 영상 내에 존재하는 모든 객체 인스턴스에 대해 분류와 지역화를 수행하는 작업 ✔ 분류 : 영상에 있는 물체의 class를 알아내는 것 ✔ 지역화 : 영상에 있는 물체의 위치를 알아내는 것 ◆ Object Detection 성능 평가 지표 IoU (Intersection over union) : 서로 다른 박스가 두개 있을 때 두 박스가 얼마나 겹치는가를 0~1 사이의 값으로 나타낸 것 ✔ 물체 검출 시 예측된 검출 영역과 실제 검출 영역의 ..

[4주차] Model Learning with Optimization

💡 "[K-MOOC] 실습으로 배우는 머신러닝"을 수강한 내용을 바탕으로 작성된 글입니다. 최적화와 모형 학습 🔎 Machine Learning and Optimization 머신러닝 모델은 파라미터를 조정하여 loss를 최소화하면서 함수를 최적화 함 Learning(학습) : 머신러닝 함수를 최적화하는 과정 [예시] Linear Regression으로 학습해보기 🔎 Loss Function of Neural Networks Nerual Network는 알아내야 하는 파라미터의 갯수가 굉장히 많음 (아래의 그림에서 모든 회색선에 각각 하나의 파라미터가 필요) 최적값을 알아내야 하는 파라미터의 갯수가 많아짐에 따라 손실함수의 그래프가 복잡해지고 고차원이 됨 🤔 복잡한 손실함수 내에서 어떤 파라미터 조정 방..

[3주차] Classification

💡 "[K-MOOC] 실습으로 배우는 머신러닝"을 수강한 내용을 바탕으로 작성된 글입니다. 머신러닝 분류 모델링 🔎 Bias-Variance Tradeoff Bias : 치우쳐져 있는 정도 / 실제 값에서 우리가 예측한 값이 얼마나 떨어져 있는가? (ex) Train Dataset에 대해 Bias가 너무 작으면 과적합 우려가 있음 Variance : 변동성 / 모집단에는 많은 샘플 데이터셋이 존재 → 각 샘플마다 학습된 모델에 차이가 존재 (ex) train에 과적합되면 변동성이 커지기 때문에 Test에 대해서는 예측을 잘못할 수 있음 ✅ 모델의 모형이 Train Dataset에 대해 Bias가 크면 Variance가 작아지는 경향이 있음 반대로 Bias가 작으면 Variance가 커지는 경향이 있음 ✅..

[2주차] Machine Learning Pipeline

💡 "[K-MOOC] 실습으로 배우는 머신러닝"을 수강한 내용을 바탕으로 작성된 글입니다. 머신러닝 프로세스 🔎 Data Science Process Prior Kowledge / Data Understanding : 배경지식 / 데이터 이해 PreParation : Prepare Data Modeling (1) 알고리즘을 사용하여 모델 만들기 (2) Training Data로 학습 (3) Test Data를 Model에 적용하고 평가하여 개선 방안 마련 (4) 최적화된 모델을 찾을 때까지 (1) ~ (3) 반복 Application : Deployment Knowledge and Actions 🔎 Data 관련 용어 Dataset : 정의된 구조로 모아져 있는 데이터 집합 Observation (Dat..

[1주차] Intorduction to Machine Learning

💡 "[K-MOOC] 실습으로 배우는 머신러닝"을 수강한 내용을 바탕으로 작성된 글입니다. [1] 인공지능과 머신러닝 🔎 AI & ML & DL Artificial Intelligence (AI) : 사람의 지능을 모방하여 현실 세계의 문제점을 해결하는 컴퓨터 시스템 Machine Learning (ML) : 데이터로부터 패턴을 학습하는 AI 방법 중 하나 Deep Learning (DL) : 인공신경망을 기반으로 하는 ML 방법 중 하나 🔎 Machine Learning 정의 데이터를 가지고 함수를 추정하는 인공지능 방법 중 하나 컴퓨터 프로그램이 경험을 통해 자동적으로 향상할 수 있도록 하는 컴퓨터 알고리즘 과거 vs. 현재 [과거의 전통적 AI] 머신러닝에서 학습하는 모델을 직접 구현 [현재의 AI..

[9주차] 추가공부

# 오늘 코드 - 조은 강사님과 함께하는 수업💖 # 9주차 동안 진행한 3일의 수업 중 더 공부해보고싶거나 복습해보고 싶었던 내용 정리입니다. Boosting Boosting 이란? 머신러닝 앙상블 기법 중 하나로 약한 학습기(weak learner)들을 순차적으로 여러개 결합하여 예측 혹은 분류 성능을 높이는 알고리즘 여러 개의 알고리즘이 순차적으로 학습-예측을 하면서 이전에 학습한 알고리즘의 예측이 틀린 데이터를 올바르게 예측할 수 있도록, 다음 알고리즘에, 가중치를 부여하여 학습과 예측을 진행하는 방식 앙상블(Ensemble) 아이디어에서 Sequential이 추가된 형태 Boosting Algorithm 종류 AdaBoost GBM(Gradient Boosting Machine) XGBoost L..

[8주차] 추가공부

# 오늘 코드 - 조은 강사님과 함께하는 수업💖 # 7주차 동안 진행한 3일의 수업 중 더 공부해보고싶거나 복습해보고 싶었던 내용 정리입니다. 이상치 탐지 (Anomaly Detection) ◆ 이상치 정의 - 변수의 분포상 비정상적으로 극단적인 값을 가져 일반적으로 생각할 수 있는 범위를 벗어난 관측치 원인 - 잘못된 데이터 입력 - 샘플링 오류 또는 잘못된 위치에서 추출 - 다른 데이터와 혼합 - 데이터의 자연적인 편차 ◆ 단변량 자료에서 이상치 탐색 표준화 점수(Z-score)를 활용한 이상치 탐색 표준화 점수는 평균이 μ 이고, 표준편차가 σ 인 정규분포를 따르는 관측치들이 자료의 중심(평균)에서 얼마나 떨어져 있는지를 나타냄 일반적으로 표준화 점수의 절대값이 3보다 큰 경우에 이상치로 정의 표준..