논문_분석 7

Complementary Pseudo Multimodal Feature for Poing Cloud Anomaly Detection(CPMF)_논문정리

Related Work1. 2D_Anomaly Detection2D AD 는 두가지 모델로 구성된다. 1.1 feature 추출목표: 표현이 뛰어난 특징 추출 (이상적으로는 정상 및 비정상 feature 가 서로 다른 분포를 가지며 쉽게 구별 가능해야한다.) 1.2 feature modeling목표: 정상 feature 의 분포를 학습하여 모델링. 비정상 feature 가 입력될 경우 정상 분포에서 벗어나도록 설계 초기 모델AESSiM, RIAD, DRAEM, Cutpaste 초기 방법들이 상당한 성능을 보였음에도 pre-trained 모델이 AD 모델에서 효과적이었다. 2. 3D_Anomaly DetectionPCD 이상 탐지를 위한 feature 모델링 모듈은 이미지 이상탐지 기법의 영향을 크게 받았..

논문_분석 2025.02.05

[논문 분석]Anomaly Detection in 3D Point Clouds using Deep Geometric Descriptors

Abstract해당 모델은 Unsupercised detection 으로 데이터의 label 없이 3D Point Cloud 에서 geometric 한 anomaly detection 을 진행하고 있다.여기에서는 Student-Teacher 구조로 진행을 하였다.1. Teachernovel self-supervised learning(dense_깊이) : 자기지도학습 사용하여 dense(촘촘한) local(세밀한) geometric descriptors 추출require annotation 과정이 필요 없음2. Student불량이 없는 point cloud로 학습한 pre-trained 된 teacher의 output 을 따라하도록 학습,test data를 사용할 때, teacher 과 student 사..

논문_분석 2025.01.10

CVT_real-time Map-view Semantic Segmentation_논문 분석2

Introduction. 기존에 Multi camera 를 사용하는 기존의 방법들은 explicit 하게 depth를 추정하고 map 으로 변환한다. 이러한 과정은 depth 추정 값을 또 map 으로 변환해줘야 하기 때문에 model 의 real-time 성능이 떨어진다. 해당 논문은 이를 해결하기 위해 기하학적 추론을 explicit 하게 수행하는 부분을 제거하여 depth 추정을 생략 한다. 대신에 공간적인 정보를 통합하여 camera-view 를 map-view 로 변환한다.Background 우리가 2D 평면상에서 보이는 물체의 위치는 실질적으로 3D, 즉 real-world 상의 물체가 2D 로 표현된것이다. Parameter 이때 우리는 Image(2D) 상의 위치 (x,y) 에 대해 rea..

논문_분석 2024.08.05

CVT_Cross-view Transformers for real-time Map-view Semantic Segmentation 논문 리뷰

자율주행에서 BEV 는 빠질수 없는 분야이다. 이에 2022년 나온 논문인 CVT 에 대해서 다뤄볼 예정이다.CVT_Cross-veiw Transformer Abstract.우리는 다중 카메라에서 map-view sementic segmentation 을 위해 효과적인 attention 기반 model 인 cross-view transformers 에 대해 발표한다. 우리의 구조는 camera-aware cross-view attention 메커니즘을 사용하여 정형화된 map-view 표현으로 개별적인 카메라 view 에서 암묵적으로 매핑을 학습한다. 각각의 카메라는 instrinsic(내적) 과 extrinsic(외적) calibration 에 따라 위치 임베딩을 사용한다. 이러한 임베딩은 transf..

논문_분석 2024.07.29

Convolution_합성곱

논문을 분석하는 중에 합성곱에 대해 확실히 이해해두고 가면 좋을듯 해서 정리합니다!  Convolution 의 필요성Input Image합성곱을 알아보기 전에 컴퓨터가 이미지를 어떻게 식별하는지를 확인해보면밑에는 흑백 이미지로 작은 사각형으로 이루어져 있다. 이 각각의 작은 사각형을 픽셀(pixel) 이라고 한다. 위 이미지를 살펴보면 가로 16, 세로 24 개의 픽셀이 존재한다. 이때 흑백 이미지는 위에와 같이 하나의 채널로 이루어져가로(16) x 세로(24) x 1 로 구성돼어 24x16 행렬의 형태로 컴퓨터가 이미지를 식별하게 된다.  밑에는 컬러이미지 이다. 컬러 이미지는 Red, Green, Blue 로 구성되는데 이때 각각의 행렬이 존재하여 채널수가 3개 이다.즉 가로(5)x 세로(5) x 3..

논문_분석 2024.07.20

Contensts1___U_NET: Convolutional Networks for Biomedical Image Segmentation_ 논문변역

Abstract.deep net-work의 성공적인 학습은 수천개의 주석이 달린 training sample들이 필요하다는 큰 합의가 있다. 이 논문에서는, 우리는 주석이 달린 sample 들은 더 효과적으로 사용할수 있게 하기 위해 강한 데이터 증간에 의존하는 네트워크 과 학습 전략을 발표한다. 이 구조는 문맥을 파악하기 위한 Contracting path(축소 경로) 와 정밀한 위치 추정이 가능하게 하는 symmetric expanding path(대칭 확장 경로) 로 구성되어 있다. 우리는 그러한 네트워크가 매우 적은 이미지로부터 끝까지(end-to-end) 학습될수 있도록 보여준다. 이는 전자 현미경 스택에서 neuronal 구조의 segmentation 을 위한 ISBI 챌린지에서 sliding..

논문_분석 2024.07.17