ค่าเฉลี่ยเคลื่อนที่ตัวอย่างนี้สอนวิธีคำนวณค่าเฉลี่ยเคลื่อนที่ของชุดเวลาใน Excel ค่าเฉลี่ยเคลื่อนที่จะใช้เพื่อทำให้เกิดความผิดปกติ (ยอดเขาและหุบเขา) เพื่อรับรู้แนวโน้มได้ง่ายขึ้น 1. ขั้นแรกให้ดูที่ซีรี่ส์เวลาของเรา 2. ในแท็บข้อมูลคลิกการวิเคราะห์ข้อมูล หมายเหตุ: ไม่สามารถหาปุ่ม Data Analysis คลิกที่นี่เพื่อโหลด Add-in Analysis ToolPak 3. เลือก Moving Average และคลิก OK 4. คลิกที่กล่อง Input Range และเลือกช่วง B2: M2 5. คลิกที่ช่อง Interval และพิมพ์ 6. 6. คลิกที่ Output Range box และเลือก cell B3 8. วาดกราฟของค่าเหล่านี้ คำอธิบาย: เนื่องจากเราตั้งค่าช่วงเป็น 6 ค่าเฉลี่ยเคลื่อนที่คือค่าเฉลี่ยของ 5 จุดข้อมูลก่อนหน้าและจุดข้อมูลปัจจุบัน เป็นผลให้ยอดเขาและหุบเขาจะเรียบออก กราฟแสดงแนวโน้มที่เพิ่มขึ้น Excel ไม่สามารถคำนวณค่าเฉลี่ยเคลื่อนที่สำหรับจุดข้อมูล 5 จุดแรกได้เนื่องจากไม่มีจุดข้อมูลก่อนหน้านี้เพียงพอ 9. ทำซ้ำขั้นตอนที่ 2 ถึง 8 สำหรับช่วงที่ 2 และช่วงที่ 4 ข้อสรุป: ช่วงที่ใหญ่กว่ายอดเนินและหุบเขาจะยิ่งเรียบขึ้น ช่วงเวลาที่สั้นกว่านี้ค่าเฉลี่ยของค่าเฉลี่ยเคลื่อนที่จะใกล้เคียงกับจุดข้อมูลที่เกิดขึ้นจริงฉันกำลังพยายาม แต่พยายามที่จะเข้าใจว่า Autoregressive and Moving Average ทำงานอย่างไร ฉันน่ากลัวมากกับพีชคณิตและมองไปที่มันไม่ได้จริงๆปรับปรุงความเข้าใจของฉันบางสิ่งบางอย่าง สิ่งที่ฉันรักจริงๆคือตัวอย่างง่ายๆในการบอกว่ามีการสังเกตการณ์ที่ขึ้นกับเวลา 10 ข้อดังนั้นฉันจึงสามารถเห็นได้ว่าพวกเขาทำงานอย่างไร สมมติว่าคุณมีจุดข้อมูลต่อไปนี้ในราคาทองคำตัวอย่างเช่นในช่วงเวลา 10 ค่าเฉลี่ยเคลื่อนที่ของ Lag 2, MA (2) จะเป็นหรือ MA (1) และ AR (1) หรือ AR (2) ฉันได้เรียนรู้เกี่ยวกับ Moving Average เป็นแบบเดิม ๆ : แต่เมื่อมองไปที่โมเดล ARMA MA ได้อธิบายไว้ในรูปของคำผิดพลาดก่อนหน้านี้ซึ่งฉันไม่สามารถเอาหัวของฉันไปรอบ ๆ ได้ เป็นเพียงวิธี fancier ของการคำนวณสิ่งเดียวกันฉันคิดว่าบทความนี้เป็นประโยชน์: (วิธีการเข้าใจ SARIMAX สังหรณ์ใจ) แต่ whist พีชคณิตช่วยฉันไม่สามารถมองเห็นสิ่งที่ชัดเจนจริงๆจนกว่าฉันจะเห็นตัวอย่างง่ายของมัน จากข้อมูลราคาทองคำคุณจะต้องประมาณแบบจำลองและดูวิธีการทำงาน (การคาดการณ์การวิเคราะห์การตอบสนองต่อแรงกระตุ้น) บางทีคุณอาจจะ จำกัด คำถามของคุณให้แคบลงเพียงแค่ส่วนที่สอง (และปล่อยให้ประมาณไว้) นั่นคือคุณจะมี AR (1) หรือ MA (1) หรือแบบใดก็ตาม (เช่น xt0.5 x varepsilont) และถามเราว่าแบบจำลองนี้ทำงานอย่างไร ndash Richard Hardy Aug 13 15 at 19:58 สำหรับแบบจำลอง AR (q) วิธีง่ายๆในการประมาณค่าพารามิเตอร์คือการใช้ OLS และเรียกใช้การถดถอยของ pricet beta0 beta1 cdot ราคา dotso betaq cdot ให้ทำ (ใน R): (เอาล่ะฉันโกงบิตและใช้ฟังก์ชัน arima ใน R แต่ให้ค่าประมาณเดียวกับการถดถอยของ OLS - ลอง) ตอนนี้ให้ดูรูปแบบ MA (1) ขณะนี้รุ่น MA แตกต่างจากรุ่น AR มาก แมสซาชูเซตส์เป็นค่าเฉลี่ยถ่วงน้ำหนักของข้อผิดพลาดในอดีตซึ่งเป็นรูปแบบ AR ใช้ค่าข้อมูลที่แท้จริงของช่วงก่อนหน้า MA (1) คือ pricet mu wt theta1 cdot w ที่ mu เป็นค่าเฉลี่ยและน้ำหนักเป็นข้อผิดพลาด - ไม่ใช่ค่า previoes ของราคา (เช่นเดียวกับในรูปแบบ AR) ตอนนี้อนิจจาเราไม่สามารถประมาณค่าพารามิเตอร์โดยใช้ OLS ได้ง่ายๆ ฉันจะไม่ครอบคลุมวิธีการที่นี่ แต่ R arima ฟังก์ชันใช้ likihood สูงสุด ลองใช้: หวังว่านี่จะช่วยได้ (2) เกี่ยวกับคำถาม MA (1) คุณบอกว่าส่วนที่เหลือคือ 1.0023 สำหรับงวดที่สอง ที่เหมาะสม ความเข้าใจของฉันเกี่ยวกับส่วนที่เหลือคือความแตกต่างระหว่างค่าที่คาดการณ์และค่าที่สังเกตได้ แต่แล้วคุณจะบอกว่าค่าที่คาดการณ์ไว้สำหรับงวดที่ 2 จะคำนวณโดยใช้ส่วนที่เหลือสำหรับช่วงเวลา 2 ค่านี้ถูกต้องค่าพยากรณ์ที่คาดการณ์สำหรับช่วงเวลา 2 เท่ากับ (0.54230 4.9977) ndash จะ TE 17 ส. ค. 52 เวลา 11: 24 การวิเคราะห์ชุดเวลาและการประยุกต์ใช้งาน : ด้วย R ตัวอย่างการแก้ไขอย่างรวดเร็วของชุดข้อมูล R series หน้านี้ใช้ JavaScript สำหรับการเน้นไวยากรณ์ ไม่จำเป็นต้องเปิดใช้งาน แต่โค้ดจะอ่านได้ยาก นี่เป็นเพียงช่วงเวลาสั้น ๆ ที่เดินเล่นลงเลน คำแนะนำของฉันคือการเปิด R และเล่นพร้อมกับบทแนะนำ หวังว่าคุณจะได้ติดตั้ง R และพบไอคอนบนเดสก์ทอปของคุณซึ่งดูเหมือนว่าอาร์ดีมันเป็นอาร์ถ้าคุณใช้ลินุกซ์แล้วก็หยุดมองเพราะมันไม่ได้อยู่ที่นั่น เพียงแค่เปิดเทอร์มินัลแล้วป้อน R (หรือติดตั้ง R Studio) หากต้องการเพิ่มเติมเกี่ยวกับกราฟิกชุดเวลาโดยเฉพาะการใช้ ggplot2 ดูการแก้ไขด่วนของกราฟิก การแก้ไขปัญหาอย่างรวดเร็วมีขึ้นเพื่อแสดงให้คุณเห็นถึงความสามารถในการใช้งาน R พื้นฐานของซีรีส์พื้นฐานและได้รับการจัดประเภทเป็นเรื่องสนุกสำหรับคนวัย 8 ถึง 80 ปีนี้ไม่ได้หมายถึงบทเรียนในการวิเคราะห์อนุกรมเวลา แต่ถ้าคุณต้องการคำแนะนำ หลักสูตร: loz Baby steps เซสชัน R แรกของคุณ ได้รับความสะดวกสบายจากนั้นเริ่มต้นของเธอและลองง่ายๆบางอย่าง: ตกลงตอนนี้คุณใช้ผู้เชี่ยวชาญ R กำลังจะได้รับ astsa ตอนนี้: ตอนนี้คุณโหลดเราสามารถเริ่มต้น ปล่อยให้ไปก่อนอื่นเล่นกับข้อมูล Johnson Johnson Johnson รวมอยู่ใน astsa เป็น jj อักขระ dynOmite จาก Good Times ก่อนอื่นให้ดูสิ และคุณเห็นว่า jj คือชุดของ 84 หมายเลขที่เรียกว่าวัตถุชุดเวลา หากต้องการใช้วัตถุของคุณ: ถ้าคุณเป็นผู้ใช้ Matlab (หรือคล้ายกัน) คุณอาจคิดว่า jj เป็นเวกเตอร์แบบ 84 ครั้ง 1 ครั้ง แต่ไม่เป็นเช่นนั้น มีลำดับและความยาว แต่ไม่มีมิติข้อมูล (ไม่มีแถวไม่มีคอลัมน์) R เรียกชนิดของวัตถุพาหะนี้ดังนั้นคุณต้องระวัง ใน R การเมทริกซ์มีมิติ แต่เวกเตอร์ไม่ได้ - พวกมันเป็นแค่ห้อยอยู่ในไซเบอร์สเปซ ตอนนี้ให้ทำชุดข้อมูลชุดข้อมูลรายเดือนที่เริ่มในเดือนมิถุนายนของปี 2293 เราป้อน Vortex โปรดทราบว่าข้อมูล Johnson และ Johnson เป็นรายได้ประจำไตรมาสดังนั้นจึงมีความถี่ 4 ชุด zardoz เป็นข้อมูลรายเดือนดังนั้นจึงมีความถี่ 12 นอกจากนี้คุณยังได้รับสิ่งที่มีประโยชน์บางอย่างกับวัตถุ ts เช่นตอนนี้ลองพล็อตข้อมูล Johnson Johnson: กราฟที่แสดงเป็นจินตนาการเล็กน้อยกว่าที่โค้ดจะให้ ดูรายละเอียดได้จากหน้า Graphics Quick Fix นี้จะไปสำหรับส่วนที่เหลือของแปลงที่คุณจะเห็นที่นี่ ลองดูสิ่งเหล่านี้และดูว่าจะเกิดอะไรขึ้น: และขณะที่คุณอยู่ที่นี่โปรดดูพล็อตและ ts. plot โปรดทราบว่าถ้าข้อมูลของคุณเป็นวัตถุแบบอนุกรมเวลาพล็อต () จะทำเคล็ดลับ (สำหรับพล็อตเวลาที่เรียบง่ายนั่นคือ) มิฉะนั้น plot. ts () จะบังคับให้กราฟิกเป็นพล็อตเวลา วิธีการกรองฟิลเตอร์ให้สอดคล้องกับจอห์นสันแอมป์จอห์นสันซีรีส์โดยใช้ค่าเฉลี่ยเคลื่อนที่สองด้านให้ลอง: fjj (t) 8539 jj (t-2) frac14 jj (t-1) frac14 jj (t) frac14 jj (t1) 8539 jj t2) และเพิ่ม lowess (lowess - คุณรู้ว่ากิจวัตรประจำวัน) พอดีเพื่อความสนุกสนาน ให้ความแตกต่างข้อมูลที่บันทึกไว้และเรียกมันว่า dljj แล้วเล่นกับ dljj ตอนนี้เป็นฮิสโทแกรมและพล็อต Q-Q ซึ่งอยู่ด้านบนสุดของอีกส่วนหนึ่ง (แต่ในทางที่ดี): ให้ตรวจสอบโครงสร้างความสัมพันธ์ของ dljj โดยใช้เทคนิคต่างๆ ก่อนอื่นให้ดูที่ตารางของ scatterplots ของ dljj (t) กับค่า lagged เส้นตรงแบบ lowess และตัวอย่าง acf เป็นสีน้ำเงินในกล่อง ตอนนี้ให้ลองดูที่ ACF และ PACF ของ dljj โปรดสังเกตว่าแกน LAG อยู่ในรูปของความถี่ 1,2,3,4,5 จึงสอดคล้องกับความล่าช้า 4,8,12,16,20 เนื่องจากความถี่ 4 ที่นี่ หากคุณไม่ชอบการติดฉลากประเภทนี้คุณสามารถแทนที่ dljj ในข้อใด ๆ ได้โดยใช้ ts (dljj, freq1) เช่น acf (ts (dljj, freq1), 20) การย้ายบนช่วยให้ลองการสลายโครงสร้างของ log (jj) ข้อผิดพลาดของฤดูกาลแนวโน้มโดยใช้ lowess ถ้าคุณต้องการตรวจสอบส่วนที่เหลือเช่นพวกเขาอยู่ใน dogtime. series 3. คอลัมน์ที่สามของซีรีส์ที่ได้รับ (ส่วนประกอบตามฤดูกาลและแนวโน้มจะอยู่ในคอลัมน์ 1 และ 2) ตรวจสอบ ACF ของส่วนที่เหลือ, acf (dogtime. series, 3) ส่วนที่เหลือ arent ขาว - ไม่ได้ปิด คุณสามารถทำได้โดยใช้หน้าต่างตามฤดูกาลท้องถิ่นเล็กน้อย (น้อย) โดยไม่คำนึงถึงระดับโลกที่ใช้โดยการระบุต่อ พิมพ์ stl เพื่อดูรายละเอียด Theres ยังมีสิ่งที่เรียกว่า StructTS ซึ่งจะพอดีกับแบบจำลองโครงสร้างเชิงพรรณนา เราไม่ใช้ฟังก์ชันเหล่านี้ในข้อความเมื่อเรานำเสนอโมเดลโครงสร้างในบทที่ 6 เนื่องจากเราต้องการใช้โปรแกรมของเราเอง นี่เป็นเวลาที่ดีที่จะอธิบาย ในด้านบนสุนัขเป็นวัตถุที่มีสิ่งต่างๆมากมาย (คำศัพท์ทางเทคนิค) ถ้าคุณพิมพ์สุนัข คุณจะเห็นคอมโพเนนต์และถ้าคุณพิมพ์สรุป (สุนัข) คุณจะได้รับสรุปเล็กน้อยของผลลัพธ์ หนึ่งในองค์ประกอบของสุนัขคือ time. series ซึ่งประกอบด้วยชุดผลลัพธ์ (ตามฤดูกาลแนวโน้มส่วนที่เหลือ) เพื่อดูส่วนประกอบของสุนัขที่เป็นวัตถุ คุณพิมพ์ dogtime. series (และคุณจะเห็นชุด 3 ชุดซึ่งเป็นชุดสุดท้ายที่มีจำนวนที่เหลืออยู่) และนี่คือเรื่องราวของ คุณจะเห็นตัวอย่างมากขึ้นในขณะที่เราย้ายไป และตอนนี้ดีจะเป็นปัญหาจากบทที่ 2 จะพอดีกับบันทึกการถดถอย (jj) betatime alpha 1 Q1 alpha 2 Q2 alpha 3 Q3 alpha 4 Q4 epsilon ที่ Qi เป็นตัวบ่งชี้ของไตรมาส 1,2,3,4 . จากนั้นตรวจสอบส่วนที่เหลือ คุณสามารถดูเมทริกซ์แบบ (ด้วยตัวแปรดัมมี่) ด้วยวิธีนี้: ตอนนี้ดูสิ่งที่เกิดขึ้น ดูพล็อตของข้อสังเกตและค่าติดตั้งของพวกเขาซึ่งแสดงให้เห็นว่าพล็อตข้อมูลที่มีการพอดีกับการซ้อนทับไม่คุ้มค่ากับไซเบอร์สเปซที่เกิดขึ้น แต่เศษของเหลือและ ACF ของเหลือจะคุ้มค่าน้ำหนักของมันในจูลส์: ทำเศษที่มีลักษณะเป็นสีขาวละเว้นความสัมพันธ์ 0 - lag, เสมอ 1 คำแนะนำ: คำตอบคือ NO ดังนั้นการถดถอยข้างต้นเป็นสิ่งที่ไม่จำเป็น ดังนั้นการเยียวยาคืออะไรคุณต้องใช้เวลาเรียนเพราะนี่ไม่ใช่บทเรียนในชุดเวลา ฉันเตือนคุณขึ้นที่ด้านบน คุณต้องระมัดระวังเมื่อคุณถอยหลังชุดครั้งเดียวในส่วนที่ล้าหลังของอีกเครื่องโดยใช้ lm () มีแพคเกจที่เรียกว่า dynlm ซึ่งทำให้ง่ายต่อการพอดีกับการถดถอยที่ล้าหลังและฉันจะพูดถึงเรื่องนี้หลังจากตัวอย่างนี้ ถ้าคุณใช้ lm () แล้วสิ่งที่คุณต้องทำคือผูกชุดข้อมูลไว้ด้วยกันโดยใช้ ts. intersect หากคุณไม่ผูกชุดไว้ด้วยกันพวกเขาจะไม่ได้รับการจัดตำแหน่งอย่างถูกต้อง เป็นตัวอย่างที่ถอยหลังการตายของโรคหลอดเลือดหัวใจรายสัปดาห์ (เซนติเมตร) ต่อมลพิษของอนุภาค (ชิ้นส่วน) ตามมูลค่าปัจจุบันและล้าหลังไปสี่สัปดาห์ (ประมาณหนึ่งเดือน) สำหรับรายละเอียดเกี่ยวกับชุดข้อมูลดูบทที่ 2 ตรวจสอบให้แน่ใจว่าได้โหลด astsa แล้ว หมายเหตุ: ไม่จำเป็นต้องเปลี่ยนชื่อ lag (part, -4) เป็น part4 เป็นเพียงตัวอย่างของสิ่งที่คุณสามารถทำได้ ทางเลือกอื่นข้างต้นเป็น dynlm แพ็กเกจที่จะต้องมีการติดตั้งแน่นอน (เช่นที่เราทำสำหรับ astsa ขึ้นที่นั่นในช่วงเริ่มต้น) หลังจากติดตั้งแพคเกจแล้วคุณสามารถทำตัวอย่างก่อนหน้าได้ดังนี้: ดีเวลาในการจำลอง ตัวย่อสำหรับการจำลอง ARIMA คือ arima. sim () นี่คือตัวอย่างบางส่วนที่ไม่มีผลลัพธ์แสดงไว้ที่นี่เพื่อให้คุณสามารถใช้งานได้ด้วยตัวคุณเอง การใช้ astsa เพื่อให้พอดีกับรูปแบบ ARIMA: คุณอาจสงสัยเกี่ยวกับความแตกต่างระหว่าง aic กับ AIC ข้างต้น สำหรับที่คุณต้องอ่านข้อความหรือเพียงแค่ไม่ต้องกังวลกับมันเพราะไม่คุ้มค่าทำลายวันของคุณคิดเกี่ยวกับมัน ใช่ส่วนที่เหลือเหล่านี้ดูขาว หากคุณต้องการพยากรณ์ ARIMA sarima. for จะรวมอยู่ใน astsa และตอนนี้สำหรับการถดถอยบางอย่างที่มีข้อผิดพลาด autocorrelated กำลังพอดีกับรูปแบบ M t alpha betat gammaP t e t โดยที่ M t และ P t คืออัตราการตาย (cmort) และอนุภาค (ชิ้นส่วน) และ e t คือความคลาดเคลื่อนที่สัมพันธ์กัน ขั้นแรกทำแบบ OLS และตรวจสอบส่วนที่เหลือ: ตอนนี้พอดีกับรูปแบบการวิเคราะห์ส่วนที่เหลือ (ไม่แสดง) ดูสมบูรณ์แบบ นี่เป็นรูปแบบ ARMAX, M t beta 0 phi 1 M t-1 phi 2 M t-2 beta 1 t beta 2 T t-1 beta 3 P t beta 4 P t-4 e t. โดยที่ e t อาจสัมพันธ์กับความสัมพันธ์กัน แรกเราลองและ ARMAX (p2, q0) แล้วมองไปที่เหลือและตระหนัก theres ไม่มีความสัมพันธ์ซ้ายดังนั้นได้ทำ ในที่สุดการวิเคราะห์สเปกตรัมรวดเร็ว: ทั้งหมดสำหรับตอนนี้ ถ้าคุณต้องการข้อมูลเพิ่มเติมเกี่ยวกับกราฟิกแบบเวลาโปรดดูที่หน้าการแก้ไขด่วนของกราฟิกหน้าตัวอย่างของซีรีส์ตัวอย่างตัวอย่างต่อไปนี้แสดงให้เห็นว่า XLMiner สามารถใช้เพื่อสำรวจข้อมูลเพื่อค้นหาแนวโน้มและตามฤดูกาลได้อย่างไร บนริบบิ้น XLMiner จากแท็บ Model ให้เลือก Help - Examples แล้ว ForecastingData Mining Examples และเปิดชุดข้อมูลตัวอย่างเช่น Income. xlsx ชุดข้อมูลนี้มีรายได้เฉลี่ยของผู้จ่ายเงินตามรัฐ โดยปกติขั้นตอนต่อไปนี้จะดำเนินการในการวิเคราะห์อนุกรมเวลา 1. ข้อมูลถูกแบ่งออกเป็นสองชุดโดยมี 60 ข้อมูลที่กำหนดให้กับชุดการฝึกอบรมและ 40 ชุดที่ได้รับมอบหมายให้ทำชุดตรวจสอบ 2. ใช้เทคนิคการสำรวจทั้งในชุดฝึกอบรมและการตรวจสอบความถูกต้อง หากผลลัพธ์อยู่ในซิงค์โมเดลจะพอดี ถ้าแปลง ACF และ PACF เหมือนกันให้ใช้โมเดลเดียวกันกับทั้งสองชุด 3. แบบจำลองเหมาะสมโดยใช้วิธีการ ARIMA (แบบอัตถดถอยรวมค่าเฉลี่ยเคลื่อนที่) 4. เมื่อโมเดลพอดีโดยใช้วิธี ARIMA XLMiner จะแสดงแปลง ACF และ PACF สำหรับส่วนที่เหลือ ถ้าแปลงเหล่านี้อยู่ในกลุ่มของ UCL และ LCL แล้วส่วนที่เหลือจะเป็นแบบสุ่มและแบบจำลองนั้นเพียงพอ 5. ถ้าส่วนที่เหลือไม่อยู่ในวงแล้วมีความสัมพันธ์กันอยู่บ้างและควรปรับปรุงรูปแบบ ขั้นแรกให้ทำพาร์ติชั่นบนข้อมูล เลือกเซลล์ภายในชุดข้อมูลจากนั้นบน Ribbon XLMiner จากแท็บ Time Series เลือก Partition เพื่อเปิดไดอะล็อก Data Partition Data Series ภายใต้รายการตัวแปรให้เลือกปีแล้วคลิก gt เพื่อไปยัง Time Variable เลือกตัวแปรที่เหลืออยู่ภายใต้รายการตัวแปรแล้วคลิก gt เพื่อรวมตัวแปรเหล่านั้นไว้ในตัวแปรในรายการข้อมูลพาร์ทิชัน ภายใต้ระบุตัวเลือกพาร์ติชันเลือกระบุระเบียนเพื่อระบุจำนวนระเบียนที่กำหนดให้กับชุดฝึกอบรมและการตรวจสอบความถูกต้อง ภายใต้ระบุระเบียนสำหรับการแบ่งพาร์ติชันเลือกระบุระเบียนจากนั้นป้อน 50 สำหรับจำนวนระเบียนชุดการฝึกอบรมและ 21 สำหรับจำนวนระเบียนการตรวจสอบความถูกต้อง ถ้าเลือกระบุเปอร์เซ็นต์ภายใต้ตัวเลือกการแบ่งพาร์ติชันระบุ XLMiner จะกำหนดเปอร์เซ็นต์ของระเบียนให้กับแต่ละชุดตามค่าที่ป้อนโดยผู้ใช้หรือป้อนโดยอัตโนมัติโดย XLMiner ภายใต้ระบุเปอร์เซ็นต์สำหรับการแบ่งพาร์ติชัน คลิกตกลง แผ่นงาน DataPartitionTS ถูกแทรกลงไปทางขวาของแผ่นงานรายได้ ในการส่งออกด้านบนวิธีแบ่งพาร์ทิชันเป็นลำดับ (เมื่อเทียบกับแบบสุ่ม) การสังเกตการณ์ครั้งแรกจำนวน 50 ชุดได้รับการกำหนดให้กับชุดฝึกอบรมและมีการตั้งข้อสังเกตอีก 21 ข้อในชุดตรวจสอบ เลือกเซลล์ในแผ่นงาน DataPartitionTS แล้วบนริบบิ้น XLMiner จากแท็บ Time Series เลือก ARIMA - Autocorrelations เพื่อแสดงกล่องโต้ตอบ ACF เลือก CA เป็นตัวแปรที่เลือกป้อน 10 สำหรับทั้ง ACF พารามิเตอร์สำหรับข้อมูลการฝึกอบรมและข้อมูลการตรวจสอบ แปลง ACF chart โดยค่าเริ่มต้น คลิกตกลง แผ่นงาน ACFOutput ถูกแทรกหลังจากแผ่นงาน DataPartitionTS หมายเหตุในแต่ละแผนภูมิที่ความสัมพันธ์กันลดลงเนื่องจากจำนวนการล่าช้าที่เพิ่มขึ้น นี่แสดงให้เห็นว่ารูปแบบที่ชัดเจนมีอยู่ในแต่ละพาร์ติชัน อย่างไรก็ตามเนื่องจากรูปแบบไม่ซ้ำสามารถสันนิษฐานได้ว่าไม่มีข้อมูลตามฤดูกาลในข้อมูล นอกจากนี้เนื่องจากแผนภูมิทั้งสองมีรูปแบบคล้ายคลึงกันเราสามารถใส่รูปแบบเดียวกันได้ทั้งแบบตรวจสอบและชุดการฝึกอบรม คลิกกลับไปที่แผ่นงาน DataPartitionTS และบนริบบิ้น XLMiner จากแท็บ Time Series เลือก ARIMA - Autocorrelations บางส่วนเพื่อเปิดกล่องโต้ตอบ PACF เลือก CA จากรายการ Variables In Input Data จากนั้นคลิก gt เพื่อย้ายตัวแปรไปยังตัวแปรที่เลือก ป้อน 40 สำหรับความล่าช้าสูงสุดภายใต้พารามิเตอร์ PACF สำหรับข้อมูลการฝึกอบรมและ 15 สำหรับพารามิเตอร์ PACF สำหรับข้อมูลการตรวจสอบ เลือกแผนภูมิ PACF ตามค่าเริ่มต้นแล้ว คลิกตกลง ACFOutput แผ่นงานจะแทรกโดยตรงทางด้านขวาของแผ่นงาน DataPartitionTS พล็อต PACF ทั้งสองแสดงรูปแบบที่คล้ายกันทั้งในชุดการตรวจสอบและการฝึกอบรม เป็นผลให้เราสามารถใช้แบบเดียวกันสำหรับทั้งสองชุด เอาต์พุต PACF สำหรับข้อมูลการฝึกอบรมข้อมูล PACF สำหรับข้อมูลการตรวจสอบความถูกต้องฟังก์ชัน PACF แสดงรูปแบบที่แน่นอนซึ่งหมายความว่ามีแนวโน้มในข้อมูล อย่างไรก็ตามเนื่องจากรูปแบบไม่ซ้ำกันเราสามารถสรุปได้ว่าข้อมูลไม่แสดงช่วงเวลาใด ๆ ทั้งแผนภูมิ ACF และ PACF แนะนำว่ารูปแบบที่ชัดเจนมีอยู่ แต่ไม่มีฤดูกาลใด ๆ ชุดข้อมูลทั้งสองมีลักษณะการทำงานเหมือนกันทั้งในชุดการฝึกอบรมและชุดตรวจสอบความถูกต้องซึ่งแสดงให้เห็นว่าแบบจำลองเดียวกันมีความเหมาะสมสำหรับแต่ละชุด ตอนนี้เราพร้อมที่จะปรับรุ่นให้เหมาะสมแล้ว แบบจำลอง ARIMA ยอมรับพารามิเตอร์สามตัว: p - จำนวนคำอัตโนมัติ (autoregressive terms) d - จำนวนความแตกต่างที่ไม่ใช่ฤดูกาลและ q - จำนวนข้อผิดพลาดที่ล่าช้า (ค่าเฉลี่ยเคลื่อนที่) จำได้ว่าพล็อต ACF ไม่มีข้อมูลตามฤดูกาลซึ่งหมายความว่าความสัมพันธ์ระหว่างกันเกือบคงที่และลดลงด้วยจำนวนที่เพิ่มขึ้น นี่แสดงให้เห็นการตั้งค่า q 0 เนื่องจากดูเหมือนว่าจะไม่มีข้อผิดพลาดที่ล่าช้า พล็อต PACF แสดงค่าขนาดใหญ่สำหรับความล่าช้าครั้งแรก แต่มีการแปลงน้อยที่สุดสำหรับความล่าช้าต่อเนื่อง นี้แนะนำการตั้งค่า p 1 กับชุดข้อมูลมากที่สุดการตั้งค่า d 1 จะเพียงพอหรืออย่างน้อยสามารถเป็นจุดเริ่มต้น คลิกกลับไปที่แผ่นงาน DataPartitionTS และบนริบบิ้น XLMiner จากแท็บ Time Series เลือกรูปแบบ ARIMA - ARIMA เพื่อสร้างไดอะล็อก Time Series - ARIMA เลือก CA จากรายการ Variables In Input Data จากนั้นคลิก gt เพื่อย้ายตัวแปรไปยังฟิลด์ Selected variables ภายใต้พารามิเตอร์ที่ไม่ใช่ฤดูกาลกำหนดอัตลักษณ์อัตโนมัติ (p) ถึง 1, ความแตกต่าง (d) ถึง 1 และค่าเฉลี่ยเคลื่อนที่ (q) เป็น 0 คลิกขั้นสูงเพื่อเปิดกล่องโต้ตอบ ARIMA - ตัวเลือกขั้นสูง เลือกค่าที่เหมาะสมและส่วนที่เหลือสร้างการคาดการณ์และรายงานช่วงความเชื่อมั่นที่คาดการณ์ไว้ ระบบจะป้อนการตั้งค่าความเชื่อมั่นเริ่มต้นของค่ามาตรฐาน 95 เมทริกซ์ผลต่าง - แปรปรวนถูกเลือกตามค่าเริ่มต้น คลิกตกลงในกล่องโต้ตอบ ARIMA-Advanced Options และอีกครั้งในกล่องโต้ตอบ Time Series - ARIMA XLMiner คำนวณและแสดงพารามิเตอร์และแผนภูมิต่างๆในแผ่นงานสองชุด ได้แก่ ARIMAOutput และ ARIMAResiduals แผ่นงาน ARIMAOutput มีรูปแบบ ARIMA แสดงอยู่ด้านล่าง ในแผ่นงานเดียวกันนี้ XLMiner ได้คำนวณค่าคงที่และเทอม AR1 สำหรับโมเดลของเรา นี่คือเงื่อนไขคงที่และ f1 ของสมการพยากรณ์ ดูผลลัพธ์ต่อไปนี้ของการทดสอบ Chi-square ค่า p-value ขนาดเล็กสำหรับคำคงที่ (0.9704) และ AR1 term (0) แสดงให้เห็นว่าแบบจำลองเหมาะสมกับข้อมูลของเรา เปิดแผ่นงาน ARIMAResiduals ตารางนี้คำนวณค่าที่แท้จริงและพอดีและส่วนที่เหลือ ดังที่แสดงในกราฟด้านล่างค่าจริงและค่าที่คาดการณ์จะเข้ากันดีพอสมควร ประโยชน์ของแบบจำลองในการคาดการณ์จะขึ้นอยู่กับการปิดค่าที่เกิดขึ้นจริงและคาดการณ์อยู่ในพล็อตเวลาของชุดการตรวจสอบ จากนั้นเราจะดูพล็อต ACF และ PACF สำหรับข้อผิดพลาดที่พบที่ด้านล่างของแผ่นงาน ARIMAOutput ความล่าช้าทั้งหมดยกเว้นความล่าช้า 1 อยู่ในวง UCL และ LCL อย่างเห็นได้ชัด นี่แสดงว่าส่วนที่เหลือเป็นแบบสุ่มและไม่มีความสัมพันธ์ซึ่งเป็นข้อบ่งชี้แรกที่พารามิเตอร์ของโมเดลมีความเพียงพอสำหรับข้อมูลนี้ ดูตารางพยากรณ์ในแผ่นงาน ARIMAOutput ตารางแสดงค่าที่แท้จริงและที่คาดการณ์ไว้ ค่า Lower and Upper แสดงค่าขอบเขตด้านล่างและด้านบนของช่วงความเชื่อมั่น มีโอกาส 95 ที่ค่าคาดการณ์จะตกอยู่ในช่วงนี้ พล็อตครั้งด้านขวาแสดงให้เห็นว่ารูปแบบที่เราติดตั้งโดยใช้ชุดฝึกอบรมและทำในชุดการตรวจสอบความถูกต้อง ค่าที่แท้จริงและที่คาดการณ์ค่อนข้างใกล้เคียงซึ่งยืนยันว่าโมเดลของเราน่าจะดีสำหรับการคาดการณ์ หากต้องการทำพล็อตค่าภายใต้คอลัมน์ด้านล่างและด้านบนในแผนภูมิเดียวกันให้เลือกกราฟจากนั้นบนริบบิ้น Excel เลือก Design - Select Data เพื่อเปิดไดอะล็อก Select Data Source สำหรับช่วงข้อมูลแผนภูมิให้ป้อน ARIMAOutputB56: G77 จากนั้นให้ยกเลิกการเลือก Error ภายใต้ Entries Legend คลิกตกลง พล็อตนี้แสดงให้เห็นว่าค่าที่แท้จริงและค่าที่คาดการณ์อยู่ในระดับความเชื่อมั่นด้านล่างและ Upper 95 แม้ว่าค่าจริงจะแปรผันเล็กน้อยค่าเหล่านี้จะอยู่ในช่วงกลางของช่วง เราสามารถสรุปได้จากผลลัพธ์ ARIMA ว่าโมเดลของเราใช้พารามิเตอร์ (1, 1, 0) แสดงให้เห็นว่าเหมาะสมกับข้อมูลหรือไม่
No comments:
Post a Comment