본문 바로가기

반응형

딥러닝 & 머신러닝

(83)
[논문 리뷰] 3D Gaussian Splatting for Real-Time Radiance Field Rendering 이번 포스팅에선 Novel-view synthesis task에서 획기적 방법을 제시한 3D Gaussian Splatting (3DGS) 에 대해 리뷰하겠습니다.3D Scene Reconstruction 3D Scene Reconstruction은 여러 각도에서 촬영한 2D 이미지를 기반으로 장면의 3D 구조를 재구성하는 기술입니다. 이를 통해 장면의 깊이, 기하학적 관계, 표면 구조 등을 포함한 3D 모델을 생성하여 컴퓨터가 더 잘 이해하고 처리할 수 있도록 합니다. 이러한 기술은 3D 모델링, SLAM, AR & VR, 자율주행과 같은 다양한 분야에서 중요한 역할을 합니다. 3D Scene Reconstruction은 딥러닝 등장 이전부터 연구되어 온 분야입니다. 초기에는 컴퓨터 비전 알고리즘을 활..
[논문 리뷰] Descanning: From Scanned to the Original Images with a Color Correction Diffusion Model 이번 게시물에선 제가 석사과정 동안 진행했던 "Descanning" 연구에 대해 소개합니다.해당 연구는 AAAI 2024에 채택되었으며, 현재 이를 확장하여 저널 제출을 준비 중입니다. 이 논문은 약 1년 반 동안 실험, 분석, 작성의 과정을 거쳤습니다. 그 과정에서 논문 내용이 대대적으로 수정되기도 하고, 수차례 밤샘 작업, 그리고 3번의 Reject을 겪기도 했습니다. 그러나 끝내 AAAI 2024 게재라는 결실을 맺게 되어 매우 기쁩니다. 현재 소스 코드는 깃허브에 정리되어 있으며, 데이터셋과 모델 가중치 파일은 저널 게재가 승인된 이후 공개할 예정입니다. 많은 관심 부탁드립니다. 감사합니다!깃허브: https://github.com/jhcha08/DescanningAbstract많은 양의 아날로그..
PyTorch에서 torch.nn.Module 클래스와 모델 구현의 개념 PyTorch는 딥러닝 모델을 구축하고 훈련하는 데 매우 유용한 라이브러리입니다. 그 핵심에는 torch.nn.Module 클래스가 있으며, 이는 모델을 정의하고 훈련하는 데 필요한 많은 기능들을 제공합니다. 이 글에서는 torch.nn.Module 클래스의 구조와 기능, 그리고 이를 어떻게 확장하여 사용자 정의 모델을 만드는지, 또한 __init__()와 forward() 메서드를 어떻게 오버라이드하여 모델을 정의하는지에 대해 다룹니다. 그뿐만 아니라, 모델을 호출할 때 model(input_data)가 어떻게 동작하는지도 설명합니다.1. torch.nn.Module 클래스의 개요torch.nn.Module은 PyTorch에서 모델을 정의할 때 기본이 되는 클래스입니다. 이 클래스를 상속받아 신경망 모..
딥러닝 모델 훈련의 어려움과 이를 타개하기 위한 방법들 https://shyu0522.tistory.com/15 딥러닝을 대하는 우리의 자세 - (A Recipe for Training Neural Networks / Andrej Karpathy)오늘 정말 너무너무 공감되서 가슴이 뜨거워질 정도였던 블로그 글을 읽게 되었다. 무려 만 32살에 Tesla AI Team 팀장을 맡게된 Andrej Karpathy의 기술 블로그를 보던중 과거의 글 중에 이런 글이 있었shyu0522.tistory.com '딥러닝을 대하는 우리의 자세'라는 포스팅이다. 딥러닝 모델 훈련을 하면서 겪는 어려움과 이를 타개하기 위한 팁들이 잘 정리되어 있어서 블로그 링크를 공유한다.
도커 (Docker) 를 활용한 3D Gaussian Splatting (3DGS) 코드 빌드 3D Gaussian Splatting (3DGS) 에 대한 자세한 논문 리뷰는 아래 제 블로그 글을 참고해주세요.https://mole-starseeker.tistory.com/158 [논문 리뷰] 3D Gaussian Splatting for Real-Time Radiance Field Rendering이번 포스팅에선 Novel-view synthesis task에서 획기적 방법을 제시한 3D Gaussian Splatting (3DGS) 에 대해 리뷰하겠습니다.3D Scene Reconstruction 3D Scene Reconstruction은 여러 각도에서 촬영한 2D 이미지를 기반으mole-starseeker.tistory.com이번 게시물에선 3D Gaussian Splatting (이하 3..
[논문 리뷰] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis 이번 포스팅에서는 "NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis" 논문을 리뷰하겠습니다. ECCV 2020의 best paper로 선정된 바 있으며, 이후 하나의 분야 자체가 되어, 3D rendering의 역사에 큰 획을 그어 나가는 중입니다. 현재는 기존 NeRF의 문제점을 고쳐나가거나, NeRF를 응용하는 논문이 많이 나오고 있습니다.개요  NeRF는 3D 장면을 생성하고 렌더링하기 위한 딥러닝 기반의 컴퓨터 비전 기술입니다. 여기서 NeRF의 풀네임은 Neural Radiance Fields 인데요. 직역하면 '신경 복사장'이라는 이해할 수 없는 단어가 나옵니다. 그냥 특정 위치 (물체의 위치 정보와 물체를 바라보는..
신경망(Neural Net), 퍼셉트론(Perceptron), 소프트맥스(Softmax) 레이어, 크로스 엔트로피(Cross-entropy) 함수, 신경망의 학습과정 신경세포의 동작 과정 신경세포(뉴런) 하나는 다른 것들과 연결되어있고, 다른 신경세포들로부터 전기 신호를 입력으로 받음. 다른 신경세포들로부터 받은 전기 신호를 신경세포 하나에서는 특정한 값을 곱해서 나름의 변환된 전기 신호를 또 만들어냄. 그래서 만들어진 전기 신호를 해당 뉴런 혹은 신경세포가 연결되어있는 다른 신경세포들에게 전달해주는 방식으로 동작함. 그러한 과정을 수학적으로 잘 모델링하면, 입력 신호를 제공해주는 신경세포로부터 받은 입력값을 x1~xn까지의 여러 값으로 정의하게 되고, 여기에 해당 신경세포는 특정 가중치를 곱해서 그걸 다 더하고, 여기에 특정 상수까지 더한 1차 선형결합식으로 새로운 신호 만들어냄. 거기에다가 최종 활성함수까지 통과해서 최종 아웃풋 만듦. 그렇게 만들어진 신호는 다른..
[논문 리뷰] Super Resolution - RFDN (ECCVW 2020) RFDN은 다음과 같이 한 문장으로 말할 수 있겠습니다. "feature distillation connection (FDC) 이라는 기술을 제안해서 residual feature distillation을 하는 모델 RFDN을 만들었다. RFDN은 multiple feature distillation connection을 이용해서 구별점이 나타나는 (즉, 특이한) feature representation들을 학습할 수 있다. 그리고 RFDN의 메인 블록인 shallow residual block (SRB) 을 사용함으로써 가벼운 모델 용량을 유지함과 동시에 residual learning의 장점까지 얻을 수 있다." ~ Residual Feature Distillation Network for Light..

반응형