인과 추론의 데이터 과학 섹션 1 _ 다양한 프레임워크
by darami[Session 1-2] 잠재적결과 프레임워크 (Potential Outcomes Framework)
출처, 위의 강의를 듣고 정리한 내용입니다.
[Session 1-1] 인과추론의 다양한 접근법
철학적 접근
1. 경험주의
- 데이비드 흄 - 인과는 인상/관념적인 경험의 반복이다.
- 관념적인 연결고리에 불과하다. ex) (먹구름 → 비) / (무릎 쑤심 → 비?)
- 칸트 - 흄이 자신에게 큰 영향을 미쳤다고 얘기함
2. 실증주의
- 관념적인 연결고리가 아닌, 과학적으로 검증하고 테스트할 수 있어야 함.
인과관계 프레임워크 : 모든 사람들이 공통적으로 인과 관계를 파악/검증할 수 있는 공통의 이해의 틀이 필요하다는 것
이 프레임워크는 공통적으로 합의된 것이 아직 없기 때문에 연사분께서 임의로 작성해 보셨다.
논리/ 이론 Oriented
(1) 이론 기반 : 인과란, 논리적 명령을 구축하는 것
데이터/증거 Oriented
(2) 통계 기반 : unbiasedness 비편향적 추론을 찾는 것 / 모수,표본
(3) 연구 디자인 기반 : removing selection bias
(4) 구조 기반 : 전형적인 실증주의 approach, 인과적인 구조를 찾는 것
어떤 것이 더 우월하고, 대체 가능한 것은 아님, 서로 상호 보완적으로 작용한다.
데이터/증거 Oriented 접근 방법들의 장단점
(1) 통계 기반
장점
- 내생성(Endogeneity) 를 평가하고 통계 지표를 계산하는 데에 유용하다.
단점
- 실제로 데이터 분석 관점에서, ‘어떻게’에 대한 구체적인 가이드를 주지 못한다.
- 반면, 디자인,구조 기반은 어느정도 데이터 분석에 대한 전략을 제시해 준다.
(2) 디자인 기반
장점
- 인과 추론에 대한 깊은 이해 없이도 어느정도 추론할 수 있다. ex) 아스피린
단점
- casual structures나 underlying 메커니즘에 대해 설명하지 않음
(3) 구조 기반
장점
- casual structures나 underlying 메커니즘에 대해 직접적으로 설명함
단점
- casual structures에 기반하고 있기 때문에 이를 잘못 산정하면 완전히 잘못된 결과를 얻을 수 있음
→ casual structures에 대한 검증이 중요함
따라서 각 방법은 상호 보완적이다.
[Session 1-2] 잠재적결과 프레임워크 (Potential Outcomes Framework)
디자인 베이스 접근 : 복잡한 통계 방법이 데이터에 적용되어있는가가 아닌, 데이터가 수집되기 전에 얼마나 연구 디자인 설계가 잘 되어있는지에 따라 성공적 인과 추론이 가능하다는 관점
- ATE on the ATT =실제 결과 - 껄 결과 (Counterfactual)
potential outcome은 모두 관찰할 수 없다.
따라서 우리는 그 ‘껄’을 안한 사람과 한 사람의 집단을 비교할 수 밖에 없다.
그래서 control group을 최대한 counterfactual과 가깝게 만들 수 밖에 없다.
책을 읽은 사람과 책을 읽지 않은 사람간에 집안,성격,학벌 등 다양하게 다른 요인이 있다면, 이 차이가 책을 읽었고/읽지 않았고의 차이라고 할 수 있을까?
이 남는 것이 선택 편향 (Selection bias)
만약 이 선택 편향을 무시할 수 있을 정도로 적다면, 이 값을 구할 수 있다.
이것이 causal mindset , 비교 가능한 control group 을 고안하도록 연구를 설계하는 것이 중요하다는 것
[Session 1-3] 인과적 사고방식
Casual Mindset의 예시
1) 사회제도가 경제 성장에 미치는 영향
쌍둥이 도시로 Institution and Economic Growth를 비교
2) 1995 시카고 폭염
노스론데일,사우스론데일은 서로 비교 가능했음
어떤 통계적 방법도 없지만 훌륭한 인과 추론 사례
→ potention outcome 프레임워의 관점에서 인과 추론은 비교 가능한 대을 찾고, 비교가능한 통제 그룹이 있는 리서치 그룹을 보완하는 것이다.
3) 학교 교육의 효과
미국 12월에 태어난 아이와 1월에 태어난 아이를 비교해 학교 교육과 미래 소득을 비교, 이처럼 연구 설계가 중요함
'인과 추론' 카테고리의 다른 글
A/B 테스트, 종합 대조 실험을 대체,보완할 수 있는 수단 Part 3 + 4 (1) | 2023.10.05 |
---|---|
인과추론의 데이터 과학 세션 7_ 인과 그래프 (0) | 2023.08.21 |
인과추론의 데이터 과학 섹션 3,4_ 무작위 통제 실험, A/B Test (0) | 2023.08.01 |
인과추론의 데이터 과학 섹션 2 _ 실험, 준실험 (2) | 2023.07.25 |
블로그의 정보
다람
darami