Total (30)

인공 지능 연구에서 관찰되는 과학적 실재론적 관점과 반실재론적 관점의 공존, 그리고 실재론적 접근의 이점 - 대형 언어 모델을 중심으로

인공 지능 연구에서 관찰되는 과학적 실재론적 관점과 반실재론적 관점의 공존, 그리고 실재론적 접근의 이점 - 대형 언어 모델을 중심으로 이 논문은 과학철학 수업에서 기말 과제로 제출해서 최고점을 받은 논문입니다. 1. 서론 현대 과학철학에서 “과학 이론의 목표는 실제 세계를 객관적으로 묘사하는 것인가”에 대한 논쟁은 여전히 해결되지 않고 진행되고 ...

Jul 1, 2025 Philosophy_of_Science,, Scientific_Reaslism,, Scientific_AntiRealism

강화학습 알고리즘 톺아보기

게시글의 내용은 밑바닥부터 시작하는 딥러닝 4권의 Ch 10. 한 걸음 더의 내용을 베이스로, 제가 공부한 내용을 추가한 것입니다. 10.1. 심층 강화 학습 알고리즘 분류 가장 큰 분류 기준 환경 모델, 즉 상태 전이 함수( $p(s’ | s,a)$ )와 보상 함수( $r(s, a, s’)$ )의 사용 여부 환경 모델을 사용하면 ...

Sep 20, 2024 Reinforcement_Learning

Encoder-only Transformer model Fine-tuning을 통해 CoLA 데이터셋 분류하기 & Scheduler-Free 적용하기

Pretraining BERT model with Code example & using The Road Less Scheduled 1. Introduction 나에게 주어진 Task는 다음과 같다. (Assignment 1) 주어진 영어 문장에 대해 문법 적합성 판정을 이진분류(binary classification)하는 데이터셋인 ...

Aug 4, 2024 Transformer, Encoder, BERT, Scheduler-Free

투빅스 20&21기 컨퍼런스 - 나만의 AI 펫프로필 만들기 후기

투빅스 20&21기 컨퍼런스 : 나만의 AI 펫 프로필 만들기 후기 0. Introduction 24년 4월부터 24년 7월까지, 대학생&대학원생 인공지능 및 데이터 분석 대표 연합 동아리 투빅스에서 나의 기수인 20기와 후배 기수인 21기의 20&21기 18회 컨퍼런스로 생성모델 팀에서 프로젝트를 진행하였다. 저번에 진행한...

Jul 14, 2024 Diffusion, LLM, Llama3, PivotalTuning, TextualInversion

Sorting with AI (AlphaDev 리뷰)

Jul 1, 2024 Sorting, Reinforcement_Learning, Deepmind, Google

Packet Loss Prediction using SSMs

Jun 21, 2024 SSM

Sound-Guided Semantic Image Manipulation (CVPR 2022) 논문 리뷰

Sound-Guided Semantic Image Manipulation (CVPR 2022) 논문 리뷰 https://arxiv.org/abs/2112.00007 0. Abstract 연구 배경 최근 생성 모델의 성공은 Multi-modal embedding space를 활용하여 텍스트 정보를 사용해 이미지를 조작할 수 있다는 ...

May 31, 2024 GAN,, CLIP,, StyleGAN,, StyleCLIP,, CV

SentencePiece Tokenizer review

1. Introduction to SentencePiece tokenizer 2018년 8월에 Google이 발표한 tokenizer library (Not an official Google product) paper link : https://arxiv.org/pdf/1808.06226.pdf Github link : https://git...

May 31, 2024 NLP, SentencePiece, Tokenizer

Diffusion Models Without Attention & SSM(State Space Model) 완전 정복

Diffusion Models Without Attention 논문 리뷰 arxiv.org 0. Abstract 최근 고화질(hi-fidelity) 이미지 생성 분야의 발전 과정에서 Denoising Diffusion Probability Model(이하 DDPM)은 생성 모델로서 매우 중요한 Key player로 등장하게 되었다. 그러나 DD...

May 18, 2024 SSM,, S4,, HiPPO,, Mamba,, Diffusion,, DDPM

Multithreading의 Race condition을 해소하기 위한 방법(Peterson's algorithm, MemoryDefense, Semaphore)

1. 기본적인 상황 처음에 주어진 Program.cs 코드를 실행하면 Main 함수에서 선언된 Thread t가 ThreadBody()에서 shared_var에 접근하고, Main 함수 스레드가 shared_var에 접근하여 총 두 개의 스레드가 공유 변수(volatile static int)인 shared_var에 접근하는 것을 알 수 있다. ...

Apr 9, 2024 Operating_System,, Multithreading,, Peterson's_algorithm

머신러닝 해석 가능성의 현 주소와 미래 전망에 대해

이 게시글은 ‘파이썬을 활용한 머신러닝 해석 가능성’의 Ch 14. ‘머신러닝 해석 가능성, 그 다음은?’의 내용 30%, 제 사견 70%를 첨가하여 정리한 내용으로 만들어졌습니다. 1. 머신러닝 해석 가능성의 현재 상황 이해 1-1. 전체 요약 ML 해석 가능성의 세 가지 주요 주제 : FAT + E 공정성 (Fairness) 책...

Mar 10, 2024 ML, DL, XAI, RLHF, DPO, SSM, Mamba

개발자 글귀_3

이 게시글의 내용은 전부 제 사견으로 이루어진 글입니다. 230208 글귀를 올리며 내 생각을 정리하는 지금 이 계정이나, 아니면 기술 블로그를 언젠가 시작할 마음은 예전부터 항상 있었다. 그치만 항상 내 수준이 무언가를 정리하여 게시글을 올릴 만큼 올라와 있다고 느낀 적은 한 번도 없기에 쉽게 시작하지 못했다. ...

Mar 10, 2024 개발자, 개발자_글귀, Developer, Developer_phrase

개발자 글귀_2

이 게시글의 내용은 전부 제 사견으로 이루어진 글입니다. 230111 “인간의 지력으로 도저히 다 이해할 수 없는 생태의 복잡성에 대한 이러한 조심스러움과 겸손함, 공경하는 마음은 사실 대단히 오래된 것이다. 이는 때로 “민들레 원칙”이라고도 불리는 철학적 개념이다.” 인류의 우월한 유전자만 남기고 열등한 ...

Mar 10, 2024 개발자, 개발자_글귀, Developer, Developer_phrase

개발자 글귀_1

이 게시글의 내용은 전부 제 사견으로 이루어진 글입니다. 221227 “코드에서와 마찬가지로 현실에서도 역시 제어할 수 없는 것에 대한 의존성을 낮추고 제어할 수 있는 것을 선택하면 쉽게 흔들리지 않는 견고한 생활을 지킬 수 있습니다.” 우리는 소프트웨어를 만들 때 어떤 클래스, 인터페이스 등을 매개변수로 ...

Mar 10, 2024 개발자, 개발자_글귀, Developer, Developer_phrase

Feature Selection & Feature Engineering 정리

이 게시글은 ‘파이썬을 활용한 머신러닝 해석 가능성’의 Ch 10. 해석 가능성을 위한 피처 선택과 피처 엔지니어링의 내용을 정리한 내용으로 만들어졌습니다. Ch 10. 해석 가능성을 위한 피처 선택과 피처 엔지니어링 0. Introduction Chapter 1, 2, 3 —> 복잡성이 머신러닝 해석 가능성을 어떻게 방해하는지에 대한 내용...

Feb 24, 2024 ML, DL, XAI, Feature_Selection, Feature_Engineering

2021 서울 공공데이터 연구 공모전 후기 - 미완

2021 서울 공공데이터 연구 공모전 후기 (미완) Upload: Proceeding… 본 연구 공모전은 2021년 9월~11월 동안 진행된 서울시 빅데이터-AI 아이디어 공모전의 최종 선정 6개팀 발표 후기입니다. 1. Introduction 2. 연구 진행 과정 3. 자치구 선정 ...

Feb 2, 2024 Bigdata, Data_Analysis, Multiple_Linear_Regression, GIS

XAI의 역사 & Feature Importance & Global model Interpretation

이 게시글은 ‘파이썬을 활용한 머신러닝 해석 가능성’, ‘XAI 설명 가능한 인공지능, 인공지능을 해부하다’ 두 도서의 내용을 혼합하여 정리하였습니다. XAI의 역사 & Feature Importance & Global model Interpretation 01. XAI의 역사와 등장배경 1. 설명 가능한 의사 결정 체계 XAI는...

Jan 27, 2024 ML, DL, XAI, Feature_Importance

AI의 발전 방향성과 AI 규제에 대한 고찰

1. AI principle 만들기 (Algorithmic Bias / Disinformation 등을 어떻게 줄이고 극복할 수 있는가?) Google, Microsoft, OpenAI 등등 현재 IT의 최전선을 달리고 있는 기업들은 각 사에서 제 정한 AI principle이 존재한다. 또한 국제 기구 중 최고의 권위를 갖고 있는 OECD에서도 A...

Jan 23, 2024 ML, DL, XAI, AI_Regularization

투빅스 19&20기 컨퍼런스 - RAG를 이용한 “투빅이 가이드 챗봇” 후기

투빅스 19&20기 컨퍼런스 : RAG를 이용한 “투빅이 가이드 챗봇” 후기 0. Introduction 23년 7월부터 20기로 활동을 시작한 대학생&대학원생 인공지능 및 빅데이터 대표 연합 동아리 투빅스에서 19&20기 컨퍼런스로 NLP 팀에서 프로젝트를 진행하였다. 이 게시글은 컨퍼런스 프로젝트에 대한 리뷰 및 설명하려...

Jan 14, 2024 ML, RAG, Chatbot, Opendomain_QA, Conference, Project

최적화(Optimization) & 경사하강(Gradient Descent)에 대한 정리

최적화(Optimization) & 경사하강(Gradient Descent)에 대한 정리 이 게시글은 딥러닝을 위한 선형대수학 저서의 6장. 최적화 파트를 정리한 내용과, 추가적으로 정리한 내용으로 만들어졌습니다. 0. 최적화(Optimization) ML, DL 분야에선 모델의 목적함수(Objective Function)인 손실 함수(L...

Dec 17, 2023 ML, DL, Optimization, Gradient_Descent

Instruction fine-tuning, Reinforcement Learning from Human Feedback(RLHF) - 미완

Instruction fine-tuning, Reinforcement Learning from Human Feedback(RLHF) Upload: Proceeding… ** 이 게시글은 아직 제작 과정 중에 있습니다! 내용이 부실하더라도 감안하여 주세요! https://youtu.be/SXpJ9EmG3s4?si=73A2nJoUpjFW5sqC 본...

Nov 12, 2023 NLP, Instruction_fine-tuning, Reinforcement_Learing_from_Human_Feedback

Zero-shot learning & Few-shot learning, Chain of thought (COT)

Zero-shot Learning & Few-shot Learning, Chain-of-thought 본 게시글은 2023년도 스탠포드 강의 CS224n의 lecture 11 -prompting, rlhf의 내용을 정리한 게시글입니다. 0. Introduction 0-1. Larger and Larger models 현재 개발되고 있는 ...

Nov 5, 2023 NLP, Zero-shot_learning, Few-shot_learning, Chain_of_thought

VIT 논문리뷰

Vision Transformer(ViT) 논문리뷰 1. 개요 Transformer 모델의 등장 이전, RNN은 오랜 시간동안 NLP(Natural Language Processing) 분야에서 기본 모델로써 활용되었다. Attention is all you need : Transformer 모델의 등장으로 인해 NLP 분야에서 RNN의 시대 종...

Sep 28, 2023 ML, DL, Transformer, VIT, Computer-Vision, Paper-Review

BERT 논문리뷰

BERT 논문리뷰 1. 개요 Language Model(LM)의 pre-training 방법은 기존의 많은 NLP 태스크에서 효율적으로 개선되어 굉장히 좋은 성능을 내고 있다. 이는 특히 전체적인 sentenct(문장) 간의 관계를 예측하는 sentence(문장) 단위 레벨의 태스크(ex. Nature Language Inference)를 목표하...

Sep 28, 2023 ML, DL, BERT, Transformer, Paper-Review

High-Resolution Image Synthesis with Latent Diffusion Models (Stable Diffusion) 논문 리뷰

High-Resolution Image Synthesis with Latent Diffusion Models (Stable diffusion) 논문리뷰 1. Introduction 이미지 합성은 엄청난 계산적 요구가 필요함에도 불구하고, 컴퓨터 비전 분야에 있어서 가장 많은 발전을 이룩한 주제이다. 특히 요즘들어 고해상도의 복잡하며 자연스러운 장...

Sep 25, 2023 ML, DL, Stable-Diffusion, LDM, Paper-Review

GAN (Generative Adversarial Networks) 논문 리뷰 & How to evaluate GANs?

GAN (Generative Adversarial Networks) 논문 리뷰 & How to evaluate GANs? 0. 이미지 데이터의 확률 분포와 생성 모델 이미지 데이터는 벡터나 행렬과 같은 데이터의 형태로 표현하여 컴퓨터가 연산을 진행할 수 있다. 이미지 데이터는 일반적인 일차원 데이터와 달리 RGB와 같은 여러 개의 채널로 이...

Sep 20, 2023 ML, DL, GAN, Evaluate-GAN, Paper-Review

앙상블 정리

앙상블 정리 0. 단일 모델의 한계 결정 트리는 이해하고 해석하기 쉬우며, 사용하기 편하고, 여러 용도로 사용할 수 있으며, 성능도 뛰어나다. 이런 결정 트리는 데이터의 축에 수직으로 분할하는 것을 기반으로 학습을 진행하기 때문에 항상 계단 모양의 결정 경계를 생성한다. 수직으로 분할한다는 특성 상, 결정 트리의 훈련 세트의 회전이 진행되면...

Aug 22, 2023 ML, DL, Ensemble, note

How to read a paper(S. Keshav) 번역

How to Read a Paper (번역) 221216 original paper : https://www.academia.edu/37525767/How_to_Read_a_Paper 제대로된 연구를 시작하기 전, 꽤 유명한 논문인 ‘논문을 보다 효율적이면서 제대로 읽기 위한 가이드를 제시하는 논문’을 번역해보았다. (논문을 읽기 위한 논문 ㅋㅋ...

Dec 16, 2022 Paper

Total (30)

인공 지능 연구에서 관찰되는 과학적 실재론적 관점과 반실재론적 관점의 공존, 그리고 실재론적 접근의 이점 - 대형 언어 모델을 중심으로

추천시스템 프로젝트 진행 후기 - Towards Open-World Recommendation with Knowledge Augmentation from Large Language Models (Dec. 2023)

강화학습 알고리즘 톺아보기

Encoder-only Transformer model Fine-tuning을 통해 CoLA 데이터셋 분류하기 & Scheduler-Free 적용하기

투빅스 20&21기 컨퍼런스 - 나만의 AI 펫프로필 만들기 후기

Sorting with AI (AlphaDev 리뷰)

Packet Loss Prediction using SSMs

Sound-Guided Semantic Image Manipulation (CVPR 2022) 논문 리뷰

SentencePiece Tokenizer review

Diffusion Models Without Attention & SSM(State Space Model) 완전 정복

Multithreading의 Race condition을 해소하기 위한 방법(Peterson's algorithm, MemoryDefense, Semaphore)

머신러닝 해석 가능성의 현 주소와 미래 전망에 대해

개발자 글귀_3

개발자 글귀_2

개발자 글귀_1

Feature Selection & Feature Engineering 정리

2021 서울 공공데이터 연구 공모전 후기 - 미완

XAI의 역사 & Feature Importance & Global model Interpretation

AI의 발전 방향성과 AI 규제에 대한 고찰

투빅스 19&20기 컨퍼런스 - RAG를 이용한 “투빅이 가이드 챗봇” 후기

최적화(Optimization) & 경사하강(Gradient Descent)에 대한 정리

Instruction fine-tuning, Reinforcement Learning from Human Feedback(RLHF) - 미완

Zero-shot learning & Few-shot learning, Chain of thought (COT)

VIT 논문리뷰

BERT 논문리뷰

High-Resolution Image Synthesis with Latent Diffusion Models (Stable Diffusion) 논문 리뷰

GAN (Generative Adversarial Networks) 논문 리뷰 & How to evaluate GANs?

앙상블 정리

How to read a paper(S. Keshav) 번역

Trending Tags