[포테이토 스터디] LRP: Layer-wise Relevance Propagation

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

Hello Potato World

[포테이토 스터디] LRP: Layer-wise Relevance Propagation 본문

Study🥔/XAI

[포테이토 스터디] LRP: Layer-wise Relevance Propagation

Heosuab 2021. 8. 2. 01:40

⋆ ｡ ˚ ☁︎ ˚ ｡ ⋆ ｡ ˚ ☽ ˚ ｡ ⋆

[XAI study_ Interpretable Machine Learning]

20210802 XAI study 발표자료 (참고블로그주소 References)

LRP: Layer-wise Relevance Propagation

d-차원 각각에 대한 Relevance score를 계산하여 prediction 설명

LRP : 분해를 통한 설명(Explanation by Decomposition)을 통해 Neural Network의 결과물을 이해할 수 있게 도와주는 방법

input x가 총 d차원으로 이루어져있다고 하면, d차원의 각각의 feature들이 최종 output을 도출하는데에 서로다른 영향력을 가지고 있다고 가정하고 이 기여도(Relevance Score)를 계산하여 분석하는 방법이다.

$x$ : sample image
$f (x)$ : 이미지 x에 대한 prediction "Rooster"
$R_{i}$ : prediction $f (x)$ 를 얻기 위해 이미지 x의 각 pixel들이 기여하는 정도(각 차원의 Relevance Score)
LRP의 결과 heatmap : 이미지 x의 각 pixel들의 Relevance Score를 색깔로 표시
=> 오른쪽 상단(수탉의 부리나 머리)을 보고 x에 대한 prediction을 "Rooster"로 출력했다는 것을 알 수 있다

Intuition & Mathematically

2-1. Intuition

LRP: Layer-wise Relevance Propagation (Top-down)
: Relevance score를 Output layer에서 Input layer 방향으로 계산해나가며 그 비중을 재분배하는 방법

모든 Neuron은 각각의 기여도(Certain Relevance)를 가지고 있다
Relevance는 Top-down 방식으로 재분배
재분배시 Relevance는 보존된다
(ex) "Rooster"의 prediction 확률이 0.9였다고 한다면, Neuron들에 Relevance score를 재분배한 후에 각 layer에서의 relevance score의 합은 0.9로 보존되어야 한다.

2-1. Mathematically

Deep Neural Network의 prediction( $f (x)$ )를 수학적으로 분해하고, Certain Relevace를 정의할 방법
=> 각 Neuron의 input과 output의 관계 이용
(Relevance Score : input의 변화에 따른 출력의 변화 정도)

2차원 입력(2weights, 1bias)을 갖는 Neuron
$y = f (x) = f (x_{1}, x_{2})$
x값의 변화에 따른 $f (x)$ 의 변화량을 통해 Relevance Score를 예측하기 위해 미분(변화량) 이용

output $f (x)$ 에 대한 각각의 입력 $x_{1}, x_{2}$ 의 기여도 표현

위와 같이 표현된 $x_{1}, x_{2}$ 의 기여도와 $f (x)$ 의 관계를 설명할 수 있는 식을 도출할 수 있는 Taylor Series 도입

Taylor Series

Taylor Series : 어떤 점에서 무한 번 미분가능한 함수를 그 점에서 미분계수 값으로 계산할 수 있는 무한급수로 표현된 함수

2차 이상의 미분계수의 항들을 error( $ϵ$ )으로 설정하여 First-order Taylor Series로 나타내면

위의 예시에서 input은 $x_{1}, x_{2}$ 이므로(실제 Neural Network에서는 더 복잡한 다변수) 다변수 함수의 Taylor급수 이용
2-dimension에서의 Taylor급수 예시

마찬가지로 error term을 이용해 나타낸 First-order Taylor Series

Middle term이 Relevance score를 결정하고, x의 변화에 따른 $f (x)$ 의 변화를 알 수 있다
불필요한 Term인 $f (a)$ 와 $ϵ$ 을 없애기 위해 0으로 근사

$f (a) = 0$
ReLU 활성화함수 특성을 이용해 $ϵ = 0$ 으로 근사

ReLU 특성을 이용한 $ϵ = 0$

예시로 사용한 그림과 같이 2개의 input $x_{1}, x_{2}$ 를 갖는 Neuron의 ReLU 함수

case 1 : 이미 0의 값을 가지므로 변형X
case 2 : Taylor급수로 표현

Taylor급수로 표현한 식을 $f (x)$ 의 weight 표현과 비교하면 $w_{1}, w_{2}$ 를 $x_{1}, x_{2}$ 각각에 대한 1차 편미분 값으로 표현할 수 있다는 것을 볼 수 있다

2차 이상의 편미분 계수는 모두 0으로 나오기 때문에(기울기 변화 없는 ReLU의 특성), 2차 이상의 미분으로 표현한 $ϵ$ 의 값이 0이 되는것을 알 수 있다
$ϵ = 0$

$f (a) = 0$ 을 만드는 a를 찾는 방법

하나의 Neuron에서, 두 개의 입력값 $x_{1}, x_{2}$ 과 ReLU 통과 후의 출력값을 도식화한 그림 (입출력의 관계)

흰색에 가까울수록 0에 가깝고 빨간색에 가까울수록 큰 값
실선표시 지점 : 모든 값이 0인 지점
점선표시 지점 : 동일한 값을 갖는 등고선

$w^{2}$ -rule을 사용하여 a값 구하는 방법

그림에서의 화살표 vector표현(관계)

$f (a) = 0$ 을 만드는 a를 구하기 위해 해당 제약조건을 만들면

구해진 t값을 사용해 다시 벡터 x를 표현하면 (a = x+tw에 대입)

따라서 $f (x)$ 를 재정의하면 ( $f (x)$ 표현식에 a대입)

$w^{2} - r u l e, z - r u l e, z^{+} - r u l e$ 등 다른 기법도 사용하여 a값을 구할 수 있다

Relevance Propagation Rule

적절한 a를 찾음으로써 하나의 Neuron의 출력 $f (x)$ 를 분해

위에서 다룬 각 Neuron에서의 계산 방법을 전체 Neural Network에 적용

Forward Pass : input $x_{p}$ 에 대한 Neural Network의 최종 output $x_{f}$
Relevance Propagation : 각 Neuron이 가지는 Relevance Score $R_{f}$ 를 $x_{f}$ 와 동일하게 설정한 다음 계속해서 Top-down 계산 수행
=> Neural Network상의 모든 Neuron들의 Relevance Score를 계산할 수 있게 된다.

Decomposition

Decomposition : input의 각 feature가 결과에 얼마나 영향을 미치는지 해체하는 방법
(ex) Image x를 "cat"으로 분류하는데 각 hidden layer에서 계산한 기여도를 토대로 해당 input image x의 feature들이 모델을 어떻게 받아들였는지 히트맵으로 도식화

Positive 영향을 준 feature : 빨강
Negative 영향을 준 Feature : Blue
=> 이마, 코, 입 주변의 pixel들이 결과에 영향을 많이 준 것을 확인할 수 있다

따라서 LRP는 Relevance Propagation과 Decomposition방법을 사용해 모델을 해부하는 방법이다

Image Application Example

LRP는 Image, Text 데이터 등에 다양하게 적용될 수 있다.

(Image Classification 모델에 LRP를 적용한 결과)

References

[1] Explaining NonLinear Classification Decisions with Deep Taylor Decomposition, Montavon et al., 2015

[2] XAI 설명 가능한 인공지능, 인공지능을 해부하다, 안재현, 2020

[3] https://angeloyeo.github.io/2019/08/17/Layerwise_Relevance_Propagation.html

[4] Opportunities and Challenges in Explainable Artificial Intelligence (XAI): A Survey, Arun et al., 2020

'Study🥔 > XAI' 카테고리의 다른 글

[포테이토 스터디] Detecting Concepts (0)	2021.06.28
[포테이토 스터디] Pixel Attribution (Saliency Maps) (0)	2021.06.28
[포테이토 스터디] Influential Instances (0)	2021.06.22
[포테이토 스터디] Prototypes and Criticisms (0)	2021.06.22
[포테이토 스터디] Local Surrogate(LIME) (0)	2021.05.24

'Study🥔/XAI' Related Articles

Comments

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Hello Potato World

Hello Potato World

[포테이토 스터디] LRP: Layer-wise Relevance Propagation 본문