ผลรวมที่เหลือของกำลังสอง (RSS) เป็นเทคนิคทางสถิติที่ใช้ในการวัดปริมาณของความแปรปรวนในชุดข้อมูลที่ไม่ได้อธิบายโดยโมเดลการถดถอยเอง แต่จะประเมินความแปรปรวนในส่วนที่เหลือหรือข้อกำหนดข้อผิดพลาด-
การถดถอยเชิงเส้นเป็นการวัดที่ช่วยกำหนดความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรตามและปัจจัยอื่น ๆ หรือมากกว่าหนึ่งปัจจัยที่เรียกว่าตัวแปรอิสระหรืออธิบาย
ประเด็นสำคัญ
- ผลรวมที่เหลือของสี่เหลี่ยม (RSS) วัดระดับความแปรปรวนในคำผิดพลาดหรือส่วนที่เหลือของแบบจำลองการถดถอย
- ยิ่งมีขนาดเล็กลงของสี่เหลี่ยมที่เหลือน้อยเท่าไหร่โมเดลของคุณก็จะเหมาะกับข้อมูลของคุณมากขึ้นเท่านั้น ยิ่งจำนวนที่เหลืออยู่ของสี่เหลี่ยมมากเท่าไหร่โมเดลของคุณก็ยิ่งยากที่จะเข้ากับข้อมูลของคุณ
- ค่าของศูนย์หมายความว่าโมเดลของคุณพอดี
- แบบจำลองทางสถิติถูกใช้โดยนักลงทุนและผู้จัดการพอร์ตเพื่อติดตามราคาการลงทุนและใช้ข้อมูลนั้นเพื่อทำนายการเคลื่อนไหวในอนาคต
- RSS ถูกใช้โดยนักวิเคราะห์ทางการเงินเพื่อประเมินความถูกต้องของแบบจำลองเศรษฐมิติของพวกเขา
ทำความเข้าใจผลรวมที่เหลือของสี่เหลี่ยม (RSS)
ในแง่ทั่วไปผลรวมของสี่เหลี่ยมเป็นเทคนิคทางสถิติที่ใช้ในการวิเคราะห์การถดถอยเพื่อตรวจสอบการกระจายตัวของจุดข้อมูล ในการวิเคราะห์การถดถอยเป้าหมายคือการกำหนดว่าชุดข้อมูลสามารถติดตั้งกับฟังก์ชั่นที่อาจช่วยอธิบายได้อย่างไรว่าชุดข้อมูลถูกสร้างขึ้นอย่างไร ผลรวมของกำลังสองใช้เป็นวิธีทางคณิตศาสตร์ในการค้นหาฟังก์ชันที่เหมาะที่สุด(แตกต่างกันน้อยที่สุด) จากข้อมูล
RSS วัดปริมาณของข้อผิดพลาดที่เหลืออยู่ระหว่างฟังก์ชั่นการถดถอยและชุดข้อมูลหลังจากเรียกใช้โมเดลแล้ว รูป RSS ขนาดเล็กแสดงถึงฟังก์ชั่นการถดถอยที่เหมาะสมกับข้อมูล
RSS หรือที่เรียกว่าผลรวมของส่วนที่เหลือกำลังสองเป็นหลักกำหนดว่าโมเดลการถดถอยจะอธิบายหรือแสดงข้อมูลในโมเดลได้ดีเพียงใด
วิธีคำนวณผลรวมที่เหลือของสี่เหลี่ยม
RSS =ni = 1 -yฉัน-f-xฉัน-2
ที่ไหน:
yฉัน= iไทยค่าของตัวแปรที่จะทำนาย
f(xฉัน) = ค่าที่คาดการณ์ของ yฉัน
n = ขีด จำกัด สูงสุดของการรวม
ผลรวมที่เหลือของสี่เหลี่ยม (RSS) เทียบกับข้อผิดพลาดมาตรฐานที่เหลือ (RSE)
ข้อผิดพลาดมาตรฐานที่เหลือ (RSE) เป็นคำศัพท์ทางสถิติอื่นที่ใช้เพื่ออธิบายความแตกต่างในส่วนเบี่ยงเบนมาตรฐานของค่าที่สังเกตได้เมื่อเทียบกับค่าที่คาดการณ์ไว้ตามที่แสดงโดยจุดในการวิเคราะห์การถดถอย มันคือความดีของพอดีการวัดที่สามารถใช้ในการวิเคราะห์ว่าชุดของจุดข้อมูลสอดคล้องกับโมเดลจริงอย่างไร
RSE คำนวณโดยการหาร RSS ด้วยจำนวนการสังเกตในตัวอย่างน้อยกว่า 2 จากนั้นใช้สแควร์รูท: RSE = [RSS/(N-2)]]1/2
ลด RSS ให้น้อยที่สุด
ในขอบเขตของการวิเคราะห์การถดถอยการลดผลรวมที่เหลือของสี่เหลี่ยมเป็นสิ่งสำคัญสำหรับการบรรลุความพอดีที่ดีที่สุดเท่าที่จะเป็นไปได้ของแบบจำลองข้อมูล ท่ามกลางเทคนิคที่แตกต่างกันในการทำให้สิ่งนี้เกิดขึ้นหนึ่งในวิธีการพื้นฐานและที่ใช้กันอย่างแพร่หลายที่สุดคือวิธีการการถดถอยกำลังสองน้อยที่สุด-
การถดถอยกำลังสองน้อยที่สุดเป็นวิธีที่มีจุดมุ่งหมายเพื่อค้นหาเส้นหรือเส้นโค้งที่ลดผลรวมของความแตกต่างกำลังสอง ความแตกต่างเหล่านี้จะอยู่ระหว่างค่าที่สังเกตและค่าที่คาดการณ์โดยแบบจำลอง ในสาระสำคัญการถดถอยกำลังสองน้อยที่สุดพยายามที่จะสร้างความสมดุลที่แบบจำลองจับแนวโน้มพื้นฐานของข้อมูลในขณะที่ยังคงลดความคลาดเคลื่อนระหว่างสิ่งที่ถูกสังเกตและสิ่งที่คาดการณ์ไว้
กระบวนการของการลด RSS ให้น้อยที่สุดผ่านการถดถอยกำลังสองน้อยที่สุดเกี่ยวข้องกับการปรับพารามิเตอร์ของโมเดลซ้ำ ๆ ซ้ำ ๆ โดยปกติแล้วจะทำจนกว่าจะมีความพอดีที่ดีที่สุด สำหรับแบบจำลองการถดถอยเชิงเส้นแบบง่าย ๆ สิ่งนี้มักจะเกี่ยวข้องกับการค้นหาความชันและการสกัดกั้นของเส้นที่เหมาะกับข้อมูลที่ดีที่สุด ในสถานการณ์ที่ซับซ้อนมากขึ้นกระบวนการจะซับซ้อนมากขึ้น แต่มีหลักการเดียวกันมากมาย
ข้อ จำกัด ของ RSS
RSS มีข้อ จำกัด บางประการ ก่อนอื่น RSS ให้น้ำหนักที่เท่ากันกับส่วนที่เหลือทั้งหมด ซึ่งหมายความว่าค่าผิดปกติสามารถมีอิทธิพลต่อ RSS อย่างไม่เป็นสัดส่วนซึ่งหมายความว่าค่าสัมประสิทธิ์โดยประมาณอาจเบ้ในเชิงลบ ข้อเสียอีกประการหนึ่งคือ RSS ขึ้นอยู่กับสมมติฐานหลายประการ หากมีข้อสันนิษฐานเช่นความเป็นเส้นตรงความเป็นอิสระของข้อผิดพลาดหรือการละเมิด homoscedasticity RSS อาจนำไปสู่การประมาณการแบบเอนเอียงและการอนุมานที่ไม่ถูกต้อง
ในขณะที่ RSS มีประโยชน์สำหรับการประเมินความพอดีของรุ่นเดียว แต่การเปรียบเทียบความพอดีกับหลายรุ่นโดยใช้ RSS เพียงอย่างเดียวอาจเป็นเรื่องยาก นี่เป็นเพราะ RSS ขึ้นอยู่กับจำนวนพารามิเตอร์ในโมเดล มันไม่ได้หมายถึงการเปรียบเทียบโมเดลกับพารามิเตอร์จำนวนมาก
สุดท้ายในขณะที่ RSS นั้นง่ายต่อการคำนวณและตีความ แต่ก็ให้ข้อมูลเชิงลึกที่ จำกัด เกี่ยวกับโครงสร้างพื้นฐานของข้อมูล ในกรณีที่การทำความเข้าใจความสัมพันธ์ระหว่างตัวทำนายและตัวแปรตอบสนองเป็นสิ่งสำคัญอาจมีตัวชี้วัดที่ดีกว่าที่จะใช้ ในบางวิธี RSS สามารถทำตัวเหมือนกกล่องดำที่ซึ่งความสัมพันธ์ไม่เป็นที่รู้จักทั้งหมด เฉพาะค่าสุดท้ายเท่านั้นที่มีความสำคัญมากที่สุด
ข้อพิจารณาพิเศษ
ตลาดการเงินได้รับแรงผลักดันเชิงปริมาณมากขึ้นเรื่อย ๆ ดังนั้นในการค้นหาขอบนักลงทุนจำนวนมากกำลังใช้เทคนิคทางสถิติขั้นสูงเพื่อช่วยในการตัดสินใจของพวกเขา ข้อมูลขนาดใหญ่การเรียนรู้ของเครื่องจักรและแอพพลิเคชั่นปัญญาประดิษฐ์จำเป็นต้องใช้คุณสมบัติทางสถิติเพื่อเป็นแนวทางในกลยุทธ์การลงทุนร่วมสมัย ผลรวมที่เหลือของสี่เหลี่ยม - หรือสถิติ RSS - เป็นหนึ่งในคุณสมบัติทางสถิติมากมายที่เพลิดเพลินกับยุคฟื้นฟูศิลปวิทยา
แบบจำลองทางสถิติถูกใช้โดยนักลงทุนและผู้จัดการพอร์ตเพื่อติดตามราคาการลงทุนและใช้ข้อมูลนั้นเพื่อทำนายการเคลื่อนไหวในอนาคต การศึกษา - การวิเคราะห์การถดถอยที่เรียกว่าอาจเกี่ยวข้องกับการวิเคราะห์ความสัมพันธ์ในการเคลื่อนไหวของราคาระหว่างสินค้าและหุ้นของ บริษัท ที่มีส่วนร่วมในการผลิตสินค้า
ข้อเท็จจริง
การค้นหาผลรวมที่เหลือของสี่เหลี่ยมด้วยมืออาจเป็นเรื่องยากและใช้เวลานาน เนื่องจากเกี่ยวข้องกับการลบการยกกำลังสองและการสรุปจำนวนมากการคำนวณอาจมีแนวโน้มที่จะเกิดข้อผิดพลาด ด้วยเหตุนี้คุณอาจตัดสินใจใช้ซอฟต์แวร์เช่น Excel เพื่อทำการคำนวณ
แบบจำลองใด ๆ อาจมีความแปรปรวนระหว่างค่าที่คาดการณ์และผลลัพธ์จริง แม้ว่าความแปรปรวนอาจอธิบายได้จากการวิเคราะห์การถดถอย แต่ RSS แสดงถึงความแปรปรวนหรือข้อผิดพลาดที่ไม่ได้อธิบาย
เนื่องจากฟังก์ชั่นการถดถอยที่ซับซ้อนเพียงพอสามารถทำเพื่อให้พอดีกับชุดข้อมูลใด ๆ อย่างใกล้ชิดการศึกษาเพิ่มเติมจึงจำเป็นเพื่อตรวจสอบว่าฟังก์ชั่นการถดถอยนั้นมีประโยชน์ในการอธิบายความแปรปรวนของชุดข้อมูลหรือไม่
อย่างไรก็ตามโดยทั่วไปแล้วค่าที่เล็กกว่าหรือต่ำกว่าสำหรับ RSS นั้นเหมาะอย่างยิ่งในทุกรุ่นเนื่องจากหมายความว่ามีการเปลี่ยนแปลงน้อยลงในชุดข้อมูล กล่าวอีกนัยหนึ่งยิ่งผลรวมของส่วนที่เหลือกำลังสองเท่าของโมเดลการถดถอยที่ดีขึ้นก็คือการอธิบายข้อมูล
ตัวอย่างของ RSS
สำหรับการสาธิตการคำนวณ RSS ที่เรียบง่าย (แต่ยาว) ให้พิจารณาความสัมพันธ์ที่รู้จักกันดีระหว่างการใช้จ่ายของผู้บริโภคของประเทศและGDP- แผนภูมิต่อไปนี้สะท้อนถึงค่าที่เผยแพร่ของการใช้จ่ายของผู้บริโภคและผลิตภัณฑ์มวลรวมภายในประเทศสำหรับ 27 รัฐของสหภาพยุโรป โปรดทราบว่าข้อมูลนี้อาจมีการเปลี่ยนแปลงเล็กน้อยเนื่องจากมีการเผยแพร่ แต่ตัวอย่างของผลรวมที่เหลือของกำลังสองยังคงถูกต้อง
การใช้จ่ายของผู้บริโภคเทียบกับ GDP สำหรับประเทศสมาชิกสหภาพยุโรป | ||
---|---|---|
ประเทศ | การใช้จ่ายของผู้บริโภค (ล้าน) |
GDP (ล้าน) |
ประเทศออสเตรีย | 309,018.88 | 433,258.47 |
เบลเยียม | 388,436.00 | 521,861.29 |
บัลแกเรีย | 54,647.31 | 69,889.35 |
โครเอเชีย | 47,392.86 | 57,203.78 |
ไซปรัส | 20,592.74 | 24,612.65 |
สาธารณรัฐเช็ก | 164,933.47 | 245,349.49 |
เดนมาร์ก | 251,478.47 | 356,084.87 |
ประเทศเอสโตเนีย | 21,776.00 | 30,650.29 |
ฟินแลนด์ | 203,731.24 | 269,751.31 |
ฝรั่งเศส | 2,057,126.03 | 2,630,317.73 |
ประเทศเยอรมนี | 2,812,718.45 | 3,846,413.93 |
กรีซ | 174,893.21 | 188,835.20 |
ฮังการี | 110,323.35 | 155,808.44 |
ไอร์แลนด์ | 160,561.07 | 425,888.95 |
อิตาลี | 1,486,910.44 | 1,888,709.44 |
ลัตเวีย | 25,776.74 | 33,707.32 |
ลิทัวเนีย | 43,679.20 | 56,546.96 |
ลักเซมเบิร์ก | 35,953.29 | 73,353.13 |
มอลตา | 9,808.76 | 14,647.38 |
เนเธอร์แลนด์ | 620,050.30 | 913,865.40 |
โปแลนด์ | 453,186.14 | 596,624.36 |
โปรตุเกส | 190,509.98 | 228,539.25 |
ประเทศโรมาเนีย | 198,867.77 | 248,715.55 |
สาธารณรัฐสโลวาเกีย | 83,845.27 | 105,172.56 |
สโลวีเนีย | 37,929.24 | 53,589.61 |
สเปน | 997,452.45 | 1,281,484.64 |
สวีเดน | 382,240.92 | 541,220.06 |
การใช้จ่ายของผู้บริโภคและ GDP มีความสัมพันธ์เชิงบวกอย่างมากและเป็นไปได้ที่จะทำนาย GDP ของประเทศตามการใช้จ่ายของผู้บริโภค (CS) ใช้สูตรสำหรับไฟล์เส้นพอดีที่ดีที่สุดความสัมพันธ์นี้สามารถประมาณได้เป็น:
GDP = 1.3232 x CS + 10447
หน่วยสำหรับทั้ง GDP และการใช้จ่ายของผู้บริโภคอยู่ในหลายล้านดอลลาร์สหรัฐ
สูตรนี้มีความแม่นยำสูงสำหรับจุดประสงค์ส่วนใหญ่ แต่มันไม่สมบูรณ์แบบเนื่องจากการเปลี่ยนแปลงของแต่ละบุคคลในเศรษฐกิจของแต่ละประเทศ แผนภูมิต่อไปนี้เปรียบเทียบ GDP ที่คาดการณ์ไว้ของแต่ละประเทศตามสูตรข้างต้นและ GDP จริงตามที่บันทึกโดยธนาคารโลก
ตัวเลข GDP ที่คาดการณ์และจริงสำหรับประเทศสมาชิกสหภาพยุโรปและสี่เหลี่ยมที่เหลืออยู่ | ||||
---|---|---|---|---|
ประเทศ | ผู้บริโภคใช้จ่ายมูลค่าล่าสุด (ล้าน) | GDP ค่าล่าสุด (ล้าน) | GDP ที่คาดการณ์ไว้ (ขึ้นอยู่กับ Trendline) | จตุรัสตกค้าง (ฉาย - จริง)^2 |
ประเทศออสเตรีย | 309,018.88 | 433,258.47 | 419,340.782016 | 193,702,038.819978 |
เบลเยียม | 388,436.00 | 521,861.29 | 524,425.52 | 6,575,250.87631504 |
บัลแกเรีย | 54,647.31 | 69,889.35 | 82,756.320592 | 165,558,932.215393 |
โครเอเชีย | 47,392.86 | 57,203.78 | 73,157.232352 | 254,512,641.947534 |
ไซปรัส | 20,592.74 | 24,612.65 | 37,695.313568 | 171,156,086.033474 |
สาธารณรัฐเช็ก | 164,933.47 | 245,349.49 | 228,686.967504 | 277,639,655.929706 |
เดนมาร์ก | 251,478.47 | 356,084.87 | 343,203.311504 | 165,934,549.28587 |
ประเทศเอสโตเนีย | 21,776.00 | 30,650.29 | 39,261.00 | 74,144,381.8126542 |
ฟินแลนด์ | 203,731.24 | 269,751.31 | 280,024.176768 | 105,531,791.633079 |
ฝรั่งเศส | 2,057,126.03 | 2,630,317.73 | 2,732,436.162896 | 10,428,174,337.1349 |
ประเทศเยอรมนี | 2,812,718.45 | 3,846,413.93 | 3,732,236.05304 | 13,036,587,587.0929 |
กรีซ | 174,893.21 | 188,835.20 | 241,865.695472 | 2,812,233,450.00581 |
ฮังการี | 110,323.35 | 155,808.44 | 156,426.85672 | 382,439.239575558 |
ไอร์แลนด์ | 160,561.07 | 425,888.95 | 222,901.407824 | 41,203,942,278.6534 |
อิตาลี | 1,486,910.44 | 1,888,709.44 | 1,977,926.894208 | 7,959,754,135.35658 |
ลัตเวีย | 25,776.74 | 33,707.32 | 44,554.782368 | 117,667,439.825176 |
ลิทัวเนีย | 43,679.20 | 56,546.96 | 68,243.32 | 136,804,777.364243 |
ลักเซมเบิร์ก | 35,953.29 | 73,353.13 | 58,020.393328 | 235,092,813.852894 |
มอลตา | 9,808.76 | 14,647.38 | 23,425.951232 | 77,063,312.875298 |
เนเธอร์แลนด์ | 620,050.30 | 913,865.40 | 830,897.56 | 6,883,662,978.71 |
โปแลนด์ | 453,186.14 | 596,624.36 | 610,102.900448 | 181,671,052.608372 |
โปรตุเกส | 190,509.98 | 228,539.25 | 262,529.805536 | 1,155,357,865.6459 |
ประเทศโรมาเนีย | 198,867.77 | 248,715.55 | 273,588.833264 | 618,680,220.331183 |
สาธารณรัฐสโลวาเกีย | 83,845.27 | 105,172.56 | 121,391.061264 | 263,039,783.25037 |
สโลวีเนีย | 37,929.24 | 53,589.61 | 60,634.970368 | 49,637,102.7149851 |
สเปน | 997,452.45 | 1,281,484.64 | 1,330,276.08184 | 2,380,604,796.8261 |
สวีเดน | 382,240.92 | 541,220.06 | 516,228.185344 | 624,593,798.821215 |
คอลัมน์ทางด้านขวาบ่งบอกถึงสี่เหลี่ยมที่เหลือ - ความแตกต่างกำลังสองระหว่างแต่ละค่าที่คาดการณ์และมูลค่าจริง ตัวเลขมีขนาดใหญ่ แต่ผลรวมของพวกเขาต่ำกว่า RSS สำหรับแนวเทรนด์อื่น ๆ ที่เป็นไปได้ หากบรรทัดที่แตกต่างกันมี RSS ที่ต่ำกว่าสำหรับจุดข้อมูลเหล่านี้บรรทัดนั้นจะเป็นเส้นพอดีที่ดีที่สุด
ผลรวมที่เหลืออยู่ของสี่เหลี่ยมเหมือนกับ R-squared หรือไม่?
ผลรวมที่เหลือของกำลังสอง (RSS) คือปริมาณที่แน่นอนของการเปลี่ยนแปลงที่อธิบายไว้ในขณะที่ R-squared เป็นปริมาณที่แน่นอนของการเปลี่ยนแปลงตามสัดส่วนของการเปลี่ยนแปลงทั้งหมด
RSS เหมือนกับผลรวมของการประเมินข้อผิดพลาด (SSE) หรือไม่?
ผลรวมที่เหลือของสี่เหลี่ยม (RSS) เป็นที่รู้จักกันว่าผลรวมของการประเมินกำลังสองของข้อผิดพลาด (SSE)
ความแตกต่างระหว่างผลรวมที่เหลือของสี่เหลี่ยมและผลรวมทั้งหมดของสี่เหลี่ยมคืออะไร?
ผลรวมทั้งหมดของกำลังสอง (TSS) วัดจำนวนการเปลี่ยนแปลงที่มีอยู่ในข้อมูลที่สังเกตได้ในขณะที่ผลรวมที่เหลือของกำลังสองวัดความแปรปรวนในข้อผิดพลาดระหว่างข้อมูลที่สังเกตได้และค่าแบบจำลอง ในสถิติค่าสำหรับผลรวมที่เหลือของกำลังสองและผลรวมทั้งหมดของสี่เหลี่ยม (TSS) มักจะเปรียบเทียบกัน
ผลรวมที่เหลือของสี่เหลี่ยมเป็นศูนย์ได้หรือไม่?
ผลรวมที่เหลือของสี่เหลี่ยมอาจเป็นศูนย์ ยิ่งมีขนาดเล็กลงของสี่เหลี่ยมที่เหลือน้อยเท่าไหร่โมเดลของคุณก็จะเหมาะกับข้อมูลของคุณมากขึ้นเท่านั้น ยิ่งจำนวนที่เหลืออยู่ของสี่เหลี่ยมมากเท่าไหร่โมเดลของคุณก็ยิ่งยากที่จะเข้ากับข้อมูลของคุณ ค่าของศูนย์หมายความว่าโมเดลของคุณพอดี
บรรทัดล่าง
ผลรวมที่เหลือของกำลังสองปริมาณความคลาดเคลื่อนระหว่างจุดข้อมูลที่สังเกตได้และการทำนายที่ทำโดยแบบจำลองการถดถอยซึ่งคำนวณเป็นผลรวมของส่วนที่เหลือกำลังสอง การลด RSS เป็นวัตถุประสงค์พื้นฐานในการวิเคราะห์การถดถอยเนื่องจากแสดงถึงระดับที่โมเดลจับความแปรปรวนในข้อมูลได้อย่างแม่นยำ