The (a,b,0) and (a,b,1) classes

(a, b, 0) 클래스

건수 분포는 음이 아닌 정수 (0, 1, 2, …)를 취하는 이산 확률 분포입니다. 건수 분포는 특정 임의의 사건의 발생을 모델링하려는 경우에 유용합니다. 일반적으로 사용되는 세 가지 건수 분포는 포아송 분포, 이항 분포 및 음이항 분포입니다. 세 가지 건수 분포를 모두 재귀적으로 생성할 수 있습니다. 이 세 분포에 대해 정수를 곱한 두 개의 연속 확률의 비율은 선형 수량으로 표현할 수 있습니다.

향후의 전개하는 요점을 명확하게하기 위해 몇 가지 표기법을 설정해 보겠습니다. 정수 k = 0, 1, 2, …에 대해 Pk 는 건수 분포가 값 k가 발생되는 확률이라고 합시다. 예를 들어, 우리는 건수의 임의 변수 N을 고려하는 경우, Pk = P [N = k] 입니다. Pk 의 두 연속되는 값의 비율은 상수 a와 b로 표현식으로 표시될 수 있습니다.

재귀 관계(1)을 만족하는 모든 건수 분포는 (a, b, 0) 분포 클래스라고 합니다. 재귀는 k=1 에서 시작되므로 P0는 고정된 확률값을 가져야 하고, 모든 Pk값의 합이 1이어야 하므로 확률 분포 전체의 합인 1에서 P1+P2+…의 합을 뺀 값으로 고정됩니다. 이와 같이 전 시점과 현 시점에 대한 성공의 비율에 대한 관계가 위의 (1) 과 같은 함수 형태의 수식으로 만족하는 경우 (a, b, 0) 분포 클래스라고 합니다.

위에서 언급 한 포아송, 이항 및 음이항의 세 가지 건수 분포는 모두 (a, b, 0) 클래스의 구성원입니다. 실제로 (a, b, 0) 클래스에는 기본적으로 세 가지 분포가 있습니다. 다시 말해, (a, b, 0) 클래스의 구성원은 포아송, 이항 및 음이항의 세 분포 중 하나여야 합니다.

(a, b, 0) 분포에는 일반적인 모수가 있습니다. 예를 들어 포아송에는 분포의 평균인 모수 λ가 있습니다. 그래서 일반적인 모수를 a, b 매개 변수로 전환하는 방법이 필요하면 그 내용은 아래 표와 같습니다.

표 1은 일반적인 모수와 a, b의 재귀 모수 사이에 변환하는 매핑을 제공

분포

분포의 모수

P0

a

b

이항 분포

n, p

(1-p)n

-p/(1-p)

(n+1) * p/(1-p)

포아송 분포

λ

e

0

λ

음이항 분포

r, p

pr

1-p

(r-1) * (1-p)

음이항 분포

평균

(1/1+θ)r

θ/(1+θ)

(r-1) * θ/(1+θ)

기하 분포

p

p

1-p

0

기하 분포

θ

1/(1+θ)

θ/(1+θ)

0

위의 공식 (1)에 k를 곱하면 다음으로 표현됩니다.

(1a)의 오른쪽은 k에 대한 선형 표현입니다. 이는 관측치를 (a, b, 0) 분포에 맞추는 방법을 제공합니다. 즉, 공식 (1a)를 활용하면 그림으로써 분포를 추정하여 분포를 적합시킬 수 있습니다.

  • 포아송 분포의 경우 기울기 a가 0이므로 그래프가 수평으로 표현
  • 음이항 분포 및 기하분포의 경우 기울기가 양이므로 그래프가 우상향으로 표현
  • 이항 분포의 경우 기울기가 음이므로 그래프가 우하향으로 표현

그러므로 이러한 분포의 선택은 이론적인 증명 과정 없이 경험적인 빈도를 통하여 적합시키는 과정이라고 이해랗 수 있습니다. 따라서 모수에 대한 확률적 이론에 근거한 추정 방식에 대하여는 별도의 추정을 통해 산출할 수 있습니다. 마지막으로 이러한 방법은 그래프를 통해 분포를 사전에 확인할 수 있는 간단한 방법니다.

예제 1

a = -1/3이고 b = 5/3라고 하자. 초기 확률 P0 = 81/256 이라고 하면 재귀 공식(1)에 따라 처음 4 개의 확률은 다음과 같습니다.

P0에서 P4 의 합이 1이 됩니다. 그러므로 이것은 이항분포여야 하며 포아송이나 음이항 분포는 아닙니다. 이항 모수는 n = 4, p = 1/4 입니다. 위의 표에 따르면, 이것은 a = -1/3 이고 b = 5/3로 변환됩니다. 초기 확률은 P0 = (1-p) 4 입니다.

예제 2

이 예제는 r=2 이고 θ=4인 음이항분포에 대한 몇 가지 확률을 재규적으로 생성하는 것입니다. 위의 표에 따르면 a=4/5이고 b=4/5 로 변환되고 다음에서 P6까지 확률을 보여줍니다.

 

위의 확률은 아래에 주어진 확률 함수를 사용하여 계산할 수도 있습니다.

(a, b, 0) 클래스의 경우 단지 확률을 재귀적으로 계산하는 것이 아닙니다. 모수 a 및 b 가 또한 모멘트 및 분산과 같은 다른 분포의 양적 정보도 제공합니다.

(a, b, 1) 클래스

(a, b, 0) 클래스가 포아송, 이항 및 음이항의 세 분포에 대한 또 다른 이름인 경우 (a, b, 0) 클래스의 요점은 무엇이고 왜 이 세 가지 분포를 개별적으로 다루지 않는 것 일까요? 물론, 확률을 재귀적으로 생성하는 것은 유용한 개념입니다. 세 분포의 확률 함수는 이미 확률을 계산하는 명확하고 정확한 방법을 제공합니다. 따라서 이 개념을 (a, b, 1)로 확장해야만 비로소 이 재귀적 방법을 하는 이유가 명확해 집니다.

먼저 보험 사고 데이터가 가지는 특성 중 하나는 사고가 발생되지 않는, 즉 무사고인 경에 많은 빈도를 나타내는 것이 일반적이며, 이후 사고의 건수가 증가함에 따라 빈도가 줄어드는 형태를 가지게 됩니다. 따라서 사고가 발생되지 않는 확률 변수 P0에 대하여 보다 많은 관심이 있으며 이러한 부분을 감안하여 분포 적합에 보다 많은 주의를 기울여야 합니다. 이러한 P0에 대한 확률을 별도로 조정하고자 하는 것이 (a, b, 1) 클레스이고 이제부터 이에 대한 부분을 설명하고자 합니다.

따라서 이제부터 다루고자 하는 것은 (a, b, 0) 클래스를 (a, b, 1) 클래스의 개념으로 이어지게 하여야만 모델링 건수 분포에서 훨씬 더 많은 유연성을 제공할 수 있습니다. 앞에서 설명한 바와 같이 (a, b, 0) 분포는 관찰되는 임의의 건수 현상을 적절하게 설명하지 못할 수 있습니다. 예를 들어, 샘플 데이터는 0에서의 확률이 (a, b, 0) 클래스의 분포에 의해 표시된 것보다 클 수도 있습니다. 하나의 대안은 P0에 더 큰 값을 할당하는 것이고, 재귀적으로 연속되는 확률 Pk(k=2, 3, 4, …)를 생성하는 것입니다. 이 재귀 관계는 (a, b, 1) 클래스의 특성으로 정의합니다.

다음의 재귀관계가 몇가지 상수 a, b를 가지는 경우 건수 분포는 분포 (a, b, 1) 클래스입니다.

재귀는 k=2에서 시작됩니다. 그렇다면 초기 확률 P0와 P1 은 임의적인 값입니까? 초기 확률 P0는 가정된 값으로 별도로 결정되는 값입니다. 그리고 P0가 결정되면 전체 확률의 합이 1이라는 원칙에 따라 확률 P1은 P1 + P2 + P3 +.. 이 1- P0가 되도록 하는 값입니다.

(a, b, 1) 클래스는 모델링에 더 많은 유연성을 제공합니다. 예를 들어, 위의 예제 2의 음이항 분포에서 초기 확률은 P0 = 0.04 이라고 합시다. 이 P0 가 실제 관찰 값보다 너무 작으면 더 큰 값을 P0에 할당한 다음 나머지 값을 재귀에 의해 확률을 생성할 수 있습니다. 예제 2를 통해 동일한 (a, b, 0) 분포를 사용하여 (a, b, 1) 을 수행하는 방법을 보여줍니다.

예제 2를 계속 진행하기 전에 (a, b, 1) 클래스에 두 개의 서브 클래스가 있습니다. 하위 클래스는 P0 = 0 또는 P0 > 0 으로 구분됩니다. (a, b, 1) 분포에서 첫 번째 경우에는 제로 절단(zero-truncated) 분포라고 하고 두 번째 경우에는 제로 수정(zero-modified) 분포라고 합니다.

  • 제로 절단 분포는 P0를 0으로 하는 수정한 특별한 형태로서 사고가 발생한 경우에만 관심을 가지는 분포의 형태로 이해할 수 있습니다.
  • 제로 수정 분포는 보험 데이터처럼 0지점(무사고)을 수정하여 별도의 확률을 부여하는 분포의 형태로 이해할 수 있으며 제로 절단 분포로부터 유도됩니다.
  • 제로 절단 분포나 제로 수정 분포는 0의 값만 수정하고 나머지 확률들은 최초의 확률값에 비례하여 배분하는 방식으로 이해할 수 있습니다.

다음은 (a, b, 1) 클레스에서의 모수와 초기값 입니다.(P0를 제외하고 (a, b, 0)과 동일)

분포

분포의 모수

제로 절단 P0

제로 수정 P0

a

b

이항 분포

n, p

0

임의의 값

-p/(1-p)

(n+1) * p/(1-p)

포아송 분포

λ

0

임의의 값

0

λ

음이항 분포

r, p

0

임의의 값

1-p

(r-1) * (1-p)

음이항 분포

r, θ

0

임의의 값

θ/(1+θ)

(r-1) * θ/(1+θ)

기하 분포

p

0

임의의 값

1-p

0

기하 분포

θ

0

임의의 값

θ/(1+θ)

0

여기에도 세 가지 관련 분포가 있으므로 여러 분포를 구분하기 위한 표기법을 설정해야 합니다. 여기서는 다음의 설정된 표기법을 사용합니다. 표기법 Pk은 (a, b, 0) 분포의 확률을 나타냅니다. 이 (a, b, 0) 분포를 통해 의 확률로 표시되는 제로 절단 분포를 도출할 수 있습니다. 이 제로 절단된 분포에서 의 확률로 표시되는 제로 수정 분포를 도출할 수 있습니다. 예를 들어, 예제 2의 음이항 분포의 경우, 우리는 제로 절단된 음이항 분포를 도출하고(예제 3), 이로부터 제로 수정 음이항 분포를 도출합니다 (예제 4).

예제 3

예제 2에서 (a, b, 0) 확률을 Pk를 k=6까지 계산했습니다. 이제 제로 절단 음이항 분포에 대한 확률 를 계산합니다. 제로 절단된 분포의 경우, 0에 대한 값이 기록되지 않습니다. 따라서 는 단순하게 Pk를 1 – P0로 나누어서 산출합니다. (정의에 따라 는 0으로 가정했음)

(k = 1, 2, 3, …)의 합은 P1, P2, P3,.. 이 확률 분포이므로 반드시 1이어야 합니다. (a, b, 0)에서 P0은 1/25입니다. 그런 다음 1-P0 = 24/25이고 이것은 1 / (1-P0) = 25/24를 의미합니다. 다음은 제로 절단 확률을 보여줍니다.

위의 결과를 통해 제로 절단 분포에서는 a = 4/5 및 b = 4/5 또는 일반적인 모수 r=2 및 θ=4를 가지는 음이항 분포의 처음 6개의 확률입니다. 위의 내용 는 수식 (2)를 사용하여 재귀적으로 계산할 수도 있습니다. 우선 을 계산하고 나머지 확률을 재귀관계 (2)를 사용하여 생성할 수 있습니다.

예제 4

예제 3의 제로 절단 음이항 분포로부터, 제로 수정 음이항 분포를 생성합니다. 원래값 P0 = 0.04이 너무 작은 경우(예를 들어 0인 클레임의 확률을 고려하기에 충분히 크지 않은 경우) 0인 확률에 더 큰 값을 지정할 수 있습니다. 만약 0.10이 더 적합하다고 가정해 봅시다. 그래서 우리는 으로 설정했습니다. 그런 다음 의 나머지의 합은 1-이고 이 예제에서는 0.9 입니다. 다음은 제로 수정 확률이 제로 절단 확률과 어떻게 관련되는지 보여줍니다.

다음은 제로 수정 음이항 분포에 대한 확률입니다.

다음과 같이 원래 (a, b, 0) 확률을 Pk를 직접 사용하여 동일한 확률을 얻을 수도 있습니다.



ETNB 분포

예제 2, 3 및 4는 (a, b, 0) 분포로 시작하여, 제로 절단 분포와 그것으로부터 제로 수정 분포를 유도하는 방법을 보여줍니다. 이 예제들에서, 우리는 음이항 분포로 시작하고 파생 분포는 제로 절단 음이항 분포와 제로 수정 음이항 분포입니다. 시작 분포가 포아송 분포인 경우 동일한 프로세스는 제로 절단 포아송 분포와 제로 수정 포아송 분포(특정 가정 값이 를 가정한)를 생성합니다.

(a, b, 0) 클래스의 구성원이 아닌 (a, b, 1) 클래스가 있습니다. 이제 이러한 (a, b, 1) 클래스인 세가지 분포에 대해 설명합니다. 그것들 중 하나를 논의하는 예제를 봅시다.

예제 5

이 예제는 확장된 절단 음이항 분포(ETNB, extended truncated negative distribution)를 가지고 작업하는 방법을 보여줍니다. 일반적인 음이항 분포에는 두 가지 모수인 r과 θ로 하는 버전 (다른 버전으로는 r과 p가 존재)이 있습니다. 두 모수는 양의 실수입니다. ETNB 분포를 정의하기 위해, 우리는 모수 r이 r>0인 경우에 더해서 -1<r<0을 가질 가능성을 포함하는 경우를 생각해 봅시다. 물론 r>0인 경우에는 일반적인 음이항 분포를 가집니다. 그러므로 -1<r<0 인 새로운 상황에 초점을 맞추어 봅시다.

이제 r=-0.2 이고 θ=1이라고 합시다. 이러한 두가지 모수를 가지고 위의 예제 3에서 보여준 바와같이 제로 절단 확률 를 생성함으로써 “음이항” 확률을 생성합니다. 이제 모수 r=-0.2 이고 θ=1이 적절한 음이항 분포에 속하지 않습니다. 실제로 Pk결과는 음수입니다. 따라서 이 “음이항” 분포는 작업을 처리하는 장치일 뿐입니다.

표 1에 따르면, r=-0.2이고 θ =1은 a = 1/2 이고 b = -3/5으로 전환됩니다. 재귀관계 (1)을 사용하여 “음이항” 확률을 생성합니다. 확률이 음수라는 것에 놀라지 마십시오.

초기 값 P0은 1보다 크고 다른 확률이라 불리는 값은 음수입니다. 그러나 이들은 ETNB 확률을 얻는 장치 일 뿐입니다. 수식 (3)에 언급된 공식을 사용하면 다음과 같이 0으로 잘린 ETNB 확률이 제공됩니다.

위에서 언급한 결과는 모수 a = 1/2 및 b = -3/5인 모수를 가지는 제로 절단 ETNB 분포의 처음 5개의 확률입니다. 이것은 (적출된) (a, b, 0) 분포에서 유래하지 않은 (a, b, 1) 분포입니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다

error: Content is protected !!