ເຖິງແມ່ນວ່າເສັ້ນໂຄ້ງມີລັກສະນະຄືກັນ, ການແຈກຢາຍ Cauchy ແລະ Gaussian ແຕກຕ່າງກັນແນວໃດ?


ຕອບ 1:

ຄວາມວຸ້ນວາຍບໍ່ເບິ່ງຄືວ່າເປັນເລື່ອງ ທຳ ມະດາ. ສິ່ງທີ່ Cauchy ເບິ່ງຄືວ່າຂື້ນກັບພາລາມິເຕີທີ່ທ່ານໃຊ້, ແຕ່ມັນເບິ່ງຄືວ່າບໍ່ປົກກະຕິ.

ເຊັ່ນ:

set.seed (1234) # ຕັ້ງຄ່າຕົວເລກເລີ່ມຕົ້ນແບບສຸ່ມ x1 <- rcauchy (1000, 0, 1) x2 <- rnorm (1000, mean (x1), sd (x1)) ແຜນວາດ (ຄວາມ ໜາ ແໜ້ນ (x1)) ແຜນວາດ (ຄວາມ ໜາ ແໜ້ນ (x2)

ບໍ່ຄືກັນເລີຍ. ແລະ x1 ຕັ້ງແຕ່ -178 ເຖິງ 702, ໃນຂະນະທີ່ x2 ຕັ້ງແຕ່ -76 ເຖິງ 71.


ຕອບ 2:

ຕາມທີ່ທ່ານເຫັນ, ເສັ້ນໂຄ້ງທັງສອງມີລັກສະນະຄ້າຍຄືກັນເຊິ່ງທັງສອງມັນມີ“ ຕຳ” ແລະແຜ່ລາມໄປເລື້ອຍໆ. ພວກມັນມີຄວາມແຕກຕ່າງກັນວ່າ Cauchy ມີຈຸດສູງສຸດແຄບແລະແຜ່ລາມໄປຊ້າໆ - ມັນມີແນວໂນ້ມທີ່ຈະໄດ້ຮັບຄຸນຄ່າທີ່ຢູ່ໄກຈາກຈຸດສູງສຸດທຽບກັບການແຈກຢາຍຕາມປົກກະຕິ. ຕາມຄະນິດສາດ, ຄວາມແຕກຕ່າງນີ້ ນຳ ໄປສູ່ຜົນສະທ້ອນທີ່ແຕກຕ່າງກັນຫຼາຍຢ່າງ - ເຊັ່ນວ່າ Cauchy ບໍ່ມີຄວາມ ໝາຍ ທີ່ຖືກ ກຳ ນົດຢ່າງຊັດເຈນແລະການແຈກຢາຍຕົວຢ່າງທີ່ແປກ, ເຊິ່ງກົດ ໝາຍ "ຈຳ ນວນຫຼວງຫຼາຍ" ບໍ່ຖືກ ນຳ ໃຊ້.


ຕອບ 3:

ເຖິງແມ່ນວ່າເສັ້ນໂຄ້ງມີລັກສະນະຄືກັນ, ການແຈກຢາຍ Cauchy ແລະ Gaussian ແຕກຕ່າງກັນແນວໃດ?

ຢູ່ເທິງພື້ນຜິວ, ພວກມັນມີລັກສະນະຄ້າຍຄືກັນ. ແຕ່ສະແດງແຜນວາດຂອງ ໜ້າ ທີ່ຄວາມ ໜາ ແໜ້ນ ຂອງການແຈກຢາຍແລະບອກຂ້ອຍວ່າມັນແມ່ນ Cauchy ຫຼື Gauss, ຂ້ອຍຈະຮູ້ວ່າແມ່ນຫຍັງ (ສົມມຸດວ່າມັນແມ່ນ ໜຶ່ງ ໃນນັ້ນ). The Cauchy ມີຫາງຍາວກວ່າ.

ຖ້າພວກເຮົາມີຄອບຄົວແຈກຢາຍທີ່ມີພາລາມິເຕີທີ່ບໍ່ຮູ້ຕົວ, ພວກເຮົາຢາກປະເມີນຕົວ ກຳ ນົດເຫຼົ່ານີ້.

  • ການແຈກຢາຍ Gaussian ມີສອງຕົວ ກຳ ນົດ, ຄວາມ ໝາຍ ແລະຄ່າບ່ຽງເບນມາດຕະຖານ. ພວກເຮົາສາມາດ ນຳ ໃຊ້ພາລາມິເຕີອື່ນໆແທນ, ຕົວຢ່າງລະດັບປານກາງ (ເຊິ່ງກົງກັບຄ່າສະເລ່ຍ) ແລະຊ່ວງເຄິ່ງ interquartile (ເຊິ່ງແມ່ນປະມານ)
  • 0.67450.6745
  • ເວລາ deviation ມາດຕະຖານ). ຄວາມ ໝາຍ ຂອງການແຈກຢາຍ Cauchy ບໍ່ມີ, ແຕ່ວ່າລະດັບປານກາງແມ່ນຈຸດໃຈກາງຂອງການປະສານສຽງ. ການບ່ຽງເບນມາດຕະຖານບໍ່ມີຢູ່, ແຕ່ວ່າສະເລ່ຍຂອງຄວາມແຕກຕ່າງສີ່ຫຼ່ຽມມົນຈາກລະດັບປານກາງແມ່ນບໍ່ມີຂອບເຂດ.

ດັ່ງນັ້ນນັ້ນແມ່ນຄວາມແຕກຕ່າງຕົ້ນຕໍ. ພວກເຮົາສາມາດພິຈາລະນາຕົວ ກຳ ນົດຂອງການແຈກຢາຍທັງສອງເປັນລະດັບປານກາງແລະເຄິ່ງກາງຂອງກາງ, ແຕ່ພວກເຮົາບໍ່ສາມາດ ນຳ ໃຊ້ຄ່ານິຍົມແລະມາດຕະຖານ ສຳ ລັບ Cauchy ເພາະວ່າມັນບໍ່ມີ.

ເມື່ອພວກເຮົາເອົາຕົວຢ່າງເພື່ອປະເມີນພາລາມິເຕີຂອງການແຈກຢາຍ, ພວກເຮົາຄິດໄລ່ສະຖິຕິເຊັ່ນ: ຄ່າສະເລ່ຍແລະການບ່ຽງເບນມາດຕະຖານຂອງຄ່າຕົວຢ່າງ. ສະຖິຕິເຫຼົ່ານີ້ມີການແຈກຢາຍ. ການແຈກຢາຍສະຖິຕິຕົວຢ່າງເອີ້ນວ່າການແຈກຢາຍຕົວຢ່າງ.

  • ຖ້າການແຈກຢາຍປະຊາກອນແມ່ນ Gauss (ການແຈກຢາຍຕົວຢ່າງຂອງຕົວຢ່າງ), ຕົວຢ່າງຂອງຕົວຢ່າງກໍ່ແມ່ນ Gauss ແລະມີການບ່ຽງເບນມາດຕະຖານທີ່ນ້ອຍກວ່າຫຼາຍ, ສະນັ້ນຕົວຢ່າງຂະ ໜາດ ໃຫຍ່ແມ່ນໃຫ້ການຄາດຄະເນທີ່ຖືກຕ້ອງຫຼາຍກ່ວາການສັງເກດ. ຖ້າການແຈກຢາຍແມ່ນ Cauchy, ຕົວຢ່າງຂອງຕົວຢ່າງຍັງມີການແຈກຢາຍ Cauchy, ແຕ່ແນ່ນອນວ່າລະດັບປານກາງແລະເຄິ່ງກາງຂອງຕົວກາງຄືກັນກັບການແຈກຢາຍເດີມ. ມັນບໍ່ມີປະໂຫຍດຫຍັງໃນການເອົາຕົວຢ່າງຂອງຕົວຢ່າງ.

ນັ້ນແມ່ນຄວາມແຕກຕ່າງອີກຢ່າງ ໜຶ່ງ. ຕົວຢ່າງຂອງຕົວຢ່າງຈາກ Gaussian ແມ່ນມີປະໂຫຍດຕໍ່ການຄາດຄະເນຄ່າສະເລ່ຍ (ຫຼືປານກາງ); ຕົວຢ່າງຂອງຕົວຢ່າງ ສຳ ລັບ Cauchy ແມ່ນບໍ່ມີປະໂຫຍດ ສຳ ລັບການປະເມີນລະດັບປານກາງ. ມັນເປັນສິ່ງທີ່ດີກວ່າທີ່ຈະໃຊ້ຕົວປານກາງຕົວຢ່າງ, ເຊິ່ງໃຫ້ການຄາດຄະເນທີ່ຖືກຕ້ອງກວ່າ.

ການໂຕ້ຖຽງທີ່ຄ້າຍຄືກັນນີ້ໃຊ້ກັບການຄາດຄະເນກະແຈກກະຈາຍ (ຢ່າງໃດກໍ່ຕາມທ່ານໄດ້ກໍານົດມັນ) ຂອງ ໜຶ່ງ ໃນສອງການແຈກຢາຍ. ການຄາດຄະເນປົກກະຕິ ສຳ ລັບການແຈກຈ່າຍ Gaussian ບໍ່ໄດ້ເຮັດວຽກ ສຳ ລັບການແຈກຢາຍ Cauchy.

ຄວາມແຕກຕ່າງທີ່ແທ້ຈິງແມ່ນຢູ່ໃນສູດຄະນິດສາດ ສຳ ລັບຄວາມ ໜາ ແໜ້ນ. ໃນຮູບແບບມາດຕະຖານ, ຄວາມ ໜາ ແໜ້ນ ຂອງ Gaussian

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

ແລະ cauchy ມີຄວາມຫນາແຫນ້ນ

1π(1+z2)\frac1{\pi(1+z^2)}

.

ໃຫ້ສັງເກດວ່າທັງສອງ

zz

s ແມ່ນແຕກຕ່າງກັນ. ໃນກໍລະນີ ທຳ ອິດ, ການບ່ຽງເບນມາດຕະຖານແມ່ນ

11

ໃນກໍລະນີທີສອງ, ສ່ວນສີ່ດ້ານເທິງ

11

.

ໜ້າ ທີ່ແຈກຢາຍ (ຄວາມເປັນໄປໄດ້ທີ່

ZzZ\le z

) ບໍ່ມີແບບຟອມປິດຢ່າງຖືກຕ້ອງ ສຳ ລັບການແຈກຢາຍ Gaussian, ແຕ່ ສຳ ລັບ Cauchy

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

ຖ້າທ່ານຕ້ອງການເສັ້ນສະແດງການແຈກຢາຍຢູ່ໃນແກນດຽວກັນເພື່ອເບິ່ງຄວາມແຕກຕ່າງ, ທ່ານຄວນປັບຕົວ ກຳ ນົດ. ສະນັ້ນຂ້າພະເຈົ້າຈະ ກຳ ນົດມາດຕະຖານ Gaussian ເພື່ອໃຫ້ຕ່ ຳ ແລະຕ່ ຳ ກວ່າ

0.6745-0.6745

ແລະ

0.67450.6745

ຕົວຢ່າງ: ເຮັດໃຫ້ການບ່ຽງເບນມາດຕະຖານຄືກັນ

1.48261.4826

ແລະໃຊ້ແບບຟອມມາດຕະຖານ ສຳ ລັບ Cauchy. ພື້ນທີ່ທີ່ຢູ່ພາຍໃຕ້ແຜນວາດຄວນຈະຄືກັນ, ດັ່ງນັ້ນຄວາມສູງທີ່ຢູ່ໃນກາງຄວນຖືກປັບຂະ ໜາດ ໃຫ້ ເໝາະ ສົມ (

0.2690.269

ສຳ ລັບ Gaussian ແລະ

0.3180.318

ສຳ ລັບຄວາມຄາງ - ຄໍ່ຂອງມັນໃຫຍ່ຂື້ນຢູ່ກາງແລະສູງກວ່າຫາງ).