Wednesday 5 July 2017

ชี้แจง ถัว เฉลี่ยเคลื่อนที่ แปรปรวน เมทริกซ์


ตัวแปรหลายตัวแปรที่ถ่วงน้ำหนักในการเคลื่อนที่แบบแปรปรวน Matrix Hawkins, Douglas M. Maboudou-Tchao, Edgard M. (ASQ American Statistical Association) มหาวิทยาลัยมินนิโซตา University of Central Florida Technometrics Vol. 50 No. 2 QICID: 24353 May 2008 หน้า 155-166 รายชื่อ 10.00 Member 5.00 สำหรับระยะเวลาที่ จำกัด การเข้าถึงเนื้อหานี้ฟรีคุณจะต้องลงชื่อเข้าใช้ใหม่ใน ASQ ลงทะเบียนที่นี่ บทคัดย่อบทคัดย่อนี้ขึ้นอยู่กับผู้เขียนบทคัดย่อ กราฟการเคลื่อนที่แบบถัวเฉลี่ยถ่วงน้ำหนักแบบยกกำลังหลายตัวแปร (MEWMA) ที่เป็นที่นิยมซึ่งมีหลายตัวแปรชี้ไปที่การเปลี่ยนแปลงเวคเตอร์เฉลี่ย แต่การเปลี่ยนแปลงอาจเกิดขึ้นได้ในตำแหน่งหรือความแปรปรวนของลักษณะคุณภาพหลายตัวแปรที่มีความสัมพันธ์ซึ่งเรียกวิธีการแบบขนานในการตรวจหาการเปลี่ยนแปลงในเมทริกซ์ความแปรปรวนร่วม เมทริกซ์ความแปรปรวนร่วมที่มีการถ่วงน้ำหนักแบบเมตริกซ์แบบเมตริกซ์แบบเมตริกซ์มีการพิจารณาเพื่อตรวจสอบความเสถียรของเมทริกซ์ความแปรปรวนร่วมของกระบวนการ เมื่อใช้ร่วมกับตำแหน่ง MEWMA แผนภูมินี้จะตรวจสอบทั้งค่าเฉลี่ยและความแปรปรวนตามที่ต้องการโดยการควบคุมกระบวนการที่เหมาะสม แผนภูมิโดยทั่วไปมีประสิทธิภาพสูงกว่าแผนภูมิที่แข่งขันกันสำหรับเมทริกซ์ความแปรปรวนร่วม แผนภูมิการควบคุมค่าเฉลี่ยเคลื่อนที่ที่ถ่วงน้ำหนักเป็นเส้นสมมุติ (EWMA) การคำนวณความสัมพันธ์ EWMA โดยใช้ Excel เราได้เรียนรู้เกี่ยวกับวิธีการประเมินความผันผวนโดยใช้ค่าเฉลี่ยเคลื่อนที่แบบถ่วงน้ำหนักแบบ EWMA ดังที่เราทราบ EWMA หลีกเลี่ยงข้อผิดพลาดของค่าเฉลี่ยที่ถ่วงน้ำหนักอย่างเท่าเทียมกันเนื่องจากให้น้ำหนักมากกว่าข้อสังเกตล่าสุดเมื่อเทียบกับข้อสังเกตที่เก่ากว่า ดังนั้นถ้าเรามีผลตอบแทนที่มากในข้อมูลของเราเมื่อเวลาผ่านไปข้อมูลเหล่านี้จะแก่กว่าและมีน้ำหนักน้อยกว่าในการคำนวณของเรา ในบทความนี้เราจะดูว่าเราสามารถคำนวณความสัมพันธ์โดยใช้ EWMA ใน Excel ได้อย่างไร เรารู้ว่าความสัมพันธ์ถูกคำนวณโดยใช้สูตรต่อไปนี้: ขั้นตอนแรกคือการคำนวณความแปรปรวนร่วมระหว่างชุดการส่งคืนสองชุด เราใช้ตัวปรับความเรียบ Lambda 0.94 ตามที่ใช้ใน RiskMetrics พิจารณาสมการต่อไปนี้: เราใช้ผลตอบแทนเป็น 2 เท่าของ x ในสมการนี้สำหรับการพยากรณ์ความแปรปรวนและผลคูณของสองผลตอบแทนเป็นชุด x ในสมการสำหรับการพยากรณ์ความแปรปรวนร่วม โปรดสังเกตว่าแลมบ์ดาเดียวกันใช้สำหรับความแปรปรวนและความแปรปรวนร่วมทั้งหมด ขั้นตอนที่สองคือการคำนวณความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานของชุดการส่งคืนแต่ละรายการตามที่อธิบายไว้ในบทความนี้คำนวณความผันผวนทางประวัติศาสตร์โดยใช้ EWMA ขั้นตอนที่สามคือการคำนวณความสัมพันธ์โดยการเสียบค่าความแปรปรวนและความเบี่ยงเบนมาตรฐานในสูตรที่กำหนดข้างต้นสำหรับความสัมพันธ์ แผ่นงาน Excel ต่อไปนี้เป็นตัวอย่างของการคำนวณความสัมพันธ์และความผันผวนของ Excel จะใช้เวลาบันทึกผลตอบแทนของสองหุ้นและคำนวณความสัมพันธ์ระหว่างพวกเขาเป็นตัวอย่างความสัมพันธ์ระหว่าง X และ Y ในเวลา t คือความแปรปรวนร่วมที่มีการถ่วงน้ำหนักที่มีการอธิบายด้วยเมตริกซ์ระหว่าง X และ Y ในเวลา t คือความผันผวนของเลขยกกำลังตัวอย่างสำหรับชุดข้อมูลเวลา X ในเวลา t คือความผันผวนที่มีการอธิบายด้วยเลขยกกำลังตัวอย่างสำหรับชุดเวลา Y ณ เวลา t เป็นปัจจัยที่ราบเรียบที่ใช้ในการคำนวณความผันผวนของเลขยกกำลังและการคำนวณความแปรปรวนร่วม หากชุดข้อมูลอินพุทไม่มีค่าเฉลี่ยศูนย์ฟังก์ชัน EWXCF Excel จะลบค่าเฉลี่ยจากข้อมูลตัวอย่างแต่ละรายการในนามของคุณ EWXCF ใช้ความผันผวนของ EWMA และการแสดง EWCOV ซึ่งไม่ถือเป็นความผันผวนเฉลี่ยในระยะยาว (หรือความแปรปรวนร่วม) และด้วยเหตุนี้สำหรับขอบฟ้าที่คาดการณ์ไว้มากกว่าหนึ่งขั้นตอน EWXCF จะส่งกลับค่าคงที่ อ้างอิงฮัลล์จอห์นซีตัวเลือกฟิวเจอร์สและอื่น ๆ การเงินอนุพันธ์ทางการเงิน Prentice Hall (2003), pp 385-387, ไอ 1-405-886145 แฮมิลตัน, J. D การวิเคราะห์อนุกรมเวลา สำนักพิมพ์มหาวิทยาลัยพรินซ์ตัน (1994), ISBN 0-691-04289-6 Tsay, Ruey S. การวิเคราะห์เวลาทางการเงิน John Wiley amp SONS (DataResion) DataFrame มีวิธีการคำนวณค่าสหสัมพันธ์แบบคู่ระหว่างชุดข้อมูลใน DataFrame โดยไม่รวมค่า NAnull ด้วย สมมติว่าข้อมูลที่หายไปสูญหายไปในแบบสุ่มทำให้ผลลัพธ์นี้เป็นค่าประมาณสำหรับเมทริกซ์ความแปรปรวนร่วมซึ่งไม่เป็นกลาง อย่างไรก็ตามสำหรับแอ็พพลิเคชันจำนวนมากการประมาณนี้อาจไม่ได้รับการยอมรับเพราะเมทริกซ์ความแปรปรวนร่วมไม่ได้รับประกันว่าจะเป็นค่ากึ่งกลางที่แน่นอน ซึ่งอาจนำไปสู่ความสัมพันธ์โดยประมาณที่มีค่าสัมบูรณ์มากกว่าหนึ่งอันและเป็นเมทริกซ์ความแปรปรวนร่วมที่ไม่สามารถผันแปรได้ ดูการคำนวณเมทริกซ์ความแปรปรวนร่วมสำหรับรายละเอียดเพิ่มเติม DataFrame. cov สนับสนุนคำหลัก minperiods ที่ระบุซึ่งระบุจำนวนการสังเกตต่ำสุดที่ต้องการสำหรับคู่ของแต่ละคอลัมน์เพื่อให้ได้ผลลัพธ์ที่ถูกต้อง น้ำหนักที่ใช้ในหน้าต่างจะถูกระบุโดยคำหลัก wintype รายการของประเภทที่เป็นที่รู้จัก ได้แก่ : รถสามล้อสามล้อ blackjack hamming bartlett parzen bohman blackmanharris nuttall barthann ไกเซอร์ (ความต้องการเบต้า) gaussian (ความต้องการ std) generalgaussian (ต้องใช้พลังงานความกว้าง) slepian (ความกว้างความต้องการ) โปรดสังเกตว่าหน้าต่าง boxcar เท่ากับ mean () สำหรับฟังก์ชัน windowing บางพารามิเตอร์เพิ่มเติมต้องระบุ: สำหรับ. sum () ด้วย wintype ไม่มีการทำให้เป็นปกติกับน้ำหนักสำหรับหน้าต่าง การผ่านน้ำหนักที่กำหนดเองของ 1, 1, 1 จะให้ผลลัพธ์ที่แตกต่างจากการใช้น้ำหนักของ 2, 2, 2 ตัวอย่างเช่น เมื่อผ่าน wintype แทนการระบุน้ำหนักอย่างชัดเจนน้ำหนักจึงเป็น normalised แล้วดังนั้นน้ำหนักที่ใหญ่ที่สุดคือ 1. ในทางตรงกันข้ามธรรมชาติของการคำนวณ mean () เป็นเช่นที่น้ำหนักจะเป็น normalised โดยให้ความสำคัญกับแต่ละอื่น ๆ น้ำหนักของ 1, 1, 1 และ 2, 2, 2 ให้ผลเหมือนกัน เวลารู้ Rolling ใหม่ในรุ่น 0.19.0 ใหม่ในรุ่น 0.19.0 มีความสามารถในการส่ง offset (หรือ convertible) ไปยัง method. rolling () และสร้างหน้าต่างขนาดตัวแปรขึ้นอยู่กับหน้าต่างเวลาที่ผ่านมา สำหรับแต่ละจุดเวลาค่านี้รวมถึงค่าก่อนหน้าทั้งหมดที่เกิดขึ้นภายในเดลต้าเวลาที่ระบุ ซึ่งอาจเป็นประโยชน์สำหรับดัชนีความถี่ที่ไม่ปกติ นี่คือดัชนีความถี่ปกติ การใช้พารามิเตอร์หน้าต่างจำนวนเต็มทำงานเพื่อหมุนตามความถี่ของหน้าต่าง การระบุการชดเชยจะช่วยให้สามารถระบุความถี่ของการกลิ้งได้ง่ายขึ้น การใช้ดัชนีที่ไม่สม่ำเสมอ แต่ยังคงเป็นแบบ monotonic การหมุนด้วยหน้าต่างจำนวนเต็มจะไม่ส่งผลต่อการคำนวณพิเศษใด ๆ การใช้สเปคเวลาจะสร้างหน้าต่างตัวแปรสำหรับข้อมูลเบาบางนี้ นอกจากนี้ตอนนี้เราอนุญาตพารามิเตอร์ตัวเลือกสำหรับระบุคอลัมน์ (แทนที่จะเป็นค่าดีฟอลต์ของดัชนี) ใน DataFrame การใช้.rolling () กับเวลาที่ใช้ดัชนีค่อนข้างคล้ายกับ resampling ทั้งสองทำงานและดำเนินการลดขนาดของวัตถุแพนด้าที่มีการจัดดัชนีเวลา เมื่อใช้. billing () กับ offset การชดเชยคือเวลาเดลต้า ใช้หน้าต่างที่มองย้อนกลับไปในเวลาต่อมาและรวมค่าทั้งหมดไว้ในหน้าต่างดังกล่าว (รวมถึงจุดสิ้นสุด แต่ไม่ใช่จุดเริ่มต้น) นี่คือมูลค่าใหม่ ณ จุดนั้นในผลลัพธ์ เหล่านี้เป็นหน้าต่างขนาดตัวแปรในพื้นที่เวลาสำหรับแต่ละจุดของอินพุต คุณจะได้รับผลลัพธ์ที่เท่ากันกับการป้อนข้อมูล เมื่อใช้. resample () กับ offset สร้างดัชนีใหม่ซึ่งเป็นความถี่ของการชดเชย สำหรับถาดความถี่แต่ละจุดรวมจากอินพุทภายในหน้าต่างมองย้อนกลับไปข้างหน้าในเวลาที่ตกอยู่ในถังขยะนั้น ผลลัพธ์ของการรวมนี้คือผลลัพธ์สำหรับจุดความถี่นั้น หน้าต่างมีขนาดคงที่ในพื้นที่ความถี่ ผลลัพธ์ของคุณจะมีรูปร่างเป็นช่วงความถี่ปกติระหว่างช่วง min และ max ของอ็อบเจ็กต์อินพุตต้นฉบับ สรุป rolling () คือการดำเนินการหน้าต่างตามเวลาขณะที่. resample () คือการทำงานของหน้าต่างที่ใช้ความถี่ Centering Windows โดยค่าเริ่มต้นป้ายชื่อจะถูกตั้งค่าไว้ที่ขอบด้านขวาของหน้าต่าง แต่มีคำหลักอยู่ตรงกลางเพื่อให้สามารถตั้งค่าป้ายกำกับได้ที่ศูนย์กลาง ฟังก์ชันหน้าต่างไบนารี cov () และ corr () สามารถคำนวณการเคลื่อนย้ายสถิติหน้าต่างเกี่ยวกับชุดข้อมูลสองชุดหรือ DataFrameSeries หรือ DataFrameDataFrame ที่รวมกันได้ นี่คือพฤติกรรมในแต่ละกรณี: Two Series คำนวณสถิติสำหรับการจับคู่ DataFrameSeries คำนวณสถิติสำหรับแต่ละคอลัมน์ของ DataFrame ด้วยชุดข้อมูลที่ผ่านมาซึ่งจะส่งกลับ DataFrame DataFrameDataFrame โดยค่าเริ่มต้นจะคำนวณสถิติสำหรับการจับคู่ชื่อคอลัมน์ส่งกลับ DataFrame ถ้าอาร์กิวเมนต์คำหลัก pairwiseTrue ถูกส่งไปแล้วจะคำนวณค่าสถิติสำหรับแต่ละคู่ของคอลัมน์ส่งคืนแผงที่มีรายการเป็นวันที่ที่ต้องการ (ดูส่วนถัดไป) ในการวิเคราะห์ข้อมูลทางการเงินและสาขาอื่น ๆ it8217s ทั่วไปในการคำนวณความแปรปรวนร่วมและเมทริกซ์ความสัมพันธ์สำหรับชุดของชุดเวลา บ่อยครั้งที่หนึ่งยังมีความสนใจในความแปรปรวนร่วมกันระหว่างการเคลื่อนที่และความสัมพันธ์ของเมทริกซ์ ซึ่งสามารถทำได้โดยการส่งผ่านอาร์กิวเมนต์คำหลัก pairwise ซึ่งในกรณีที่อินพุต DataFrame จะแสดงผล Panel ที่มีรายการอยู่ในคำถาม ในกรณีที่มีอาร์กิวเมนต์ DataFrame แบบเดียวอาร์กิวเมนต์ pairwise สามารถถูกละเว้นได้: ค่าที่หายไปจะถูกละเลยและแต่ละรายการจะคำนวณโดยใช้การสังเกตที่สมบูรณ์แบบแบบ pairwise โปรดดูส่วนความแปรปรวนร่วมสำหรับข้อแม้ที่เกี่ยวข้องกับวิธีการนี้ในการคำนวณความแปรปรวนร่วมและเมทริกซ์ความสัมพันธ์ นอกเหนือจากการไม่มีพารามิเตอร์หน้าต่างฟังก์ชันเหล่านี้มีอินเทอร์เฟซเดียวกันกับคู่ขนาน เช่นเดียวกับข้างต้นพารามิเตอร์ที่พวกเขายอมรับคือ minperiods เกณฑ์จุดข้อมูลที่ไม่เป็นโมฆะที่ต้องการ ค่าเริ่มต้นต่ำสุดที่จำเป็นในการคำนวณสถิติ ไม่มี NaN จะถูกส่งออกเมื่อ minperiods จุดข้อมูลที่ไม่เป็นโมฆะได้รับการเห็น ศูนย์ boolean ไม่ว่าจะตั้งป้ายชื่อไว้ที่กึ่งกลาง (ค่าดีฟอลต์คือ False) ผลลัพธ์ของวิธีการ. rolling และ. expanding จะไม่คืนค่า NaN หากมีค่ามิลลิลิตรอย่างน้อย minperiods ในหน้าต่างปัจจุบัน นี้แตกต่างจาก cumsum cumprod cummax และคัมมิน ซึ่งส่งกลับ NaN ในเอาต์พุตที่ใดก็ตามที่ NaN พบในอินพุท สถิติการขยายหน้าต่างจะมีเสถียรภาพมากขึ้น (และมีการตอบสนองน้อยกว่าคู่สัญญาของหน้าต่างรีดลำตุ้งเนื่องจากขนาดหน้าต่างที่เพิ่มขึ้นจะลดผลกระทบโดยสัมพัทธ์ของแต่ละจุดข้อมูล ตัวอย่างเช่นนี่คือค่าเฉลี่ย () สำหรับชุดข้อมูลชุดเวลาก่อนหน้านี้: Windows แบบมีการแจกแจงความถี่แบบยกตอนฟังก์ชันที่เกี่ยวข้อง ได้แก่ แบบยกกำลังสองของสถิติข้างต้น มีการเข้าถึงอินเทอร์เฟซที่คล้ายกับ. rolling และ. expanding ผ่านทางวิธี. wm เพื่อรับวัตถุ EWM มีการขยายวิธีการ EW จำนวนมาก (แบบถ่วงน้ำหนักแบบทวีคูณ) ดังนี้

No comments:

Post a Comment