დროის სერიების ანალიზი და პროგნოზირება. დროის სერიების ანალიზი. ფინანსური პროგნოზირების მეთოდები

12.01.2022

07.10.2013 ტაილერ ჩესმენი

დროის სერიების პროგნოზირების ძირითადი იდეების გაგება და ზოგიერთი დეტალის ცოდნა მოგცემთ უპირატესობას SQL Server Analysis Services-ში (SSAS) პროგნოზირების შესაძლებლობების გამოყენებაში.

ეს სტატია აღწერს მონაცემთა მოპოვების ტექნოლოგიების დაუფლებისთვის აუცილებელ ძირითად ცნებებს. გარდა ამისა, ჩვენ გავაშუქებთ რამდენიმე დახვეწილობას, რათა მათ პრაქტიკაში შეხვედრისას გული არ დაკარგოთ (იხილეთ გვერდითი ზოლი „რატომ არის მონაცემთა მოპოვება ასე არაპოპულარული“).

დროდადრო, SQL Server-ის პროფესიონალებს სჭირდებათ მომავალი ღირებულების პერსპექტიული შეფასებების გაკეთება, როგორიცაა შემოსავლის ან გაყიდვების პროგნოზი. ორგანიზაციები ზოგჯერ იყენებენ მონაცემთა მოპოვების ტექნოლოგიას პროგნოზირებადი მოდელების შესაქმნელად, რათა უზრუნველყონ ეს შეფასებები. მას შემდეგ რაც გაიგებთ ძირითად კონცეფციებს და ზოგიერთ დეტალს, თქვენ დაიწყებთ SQL Server Analysis Services-ის (SSAS) პროგნოზირების შესაძლებლობების წარმატებით გამოყენებას.

პროგნოზირების მეთოდები

პროგნოზირების სხვადასხვა მიდგომა არსებობს. მაგალითად, Forecasting Methods ვებგვერდი (forecastingmethods.org) განასხვავებს პროგნოზირების მეთოდების სხვადასხვა კატეგორიას, მათ შორის შემთხვევით (სხვაგვარად ეკონომიკურ-მათემატიკური), ექსპერტის მოდელირება (სუბიექტური), დროის სერიები, ხელოვნური ინტელექტი, პროგნოზის ბაზარი, ალბათური პროგნოზირება, პროგნოზირების მოდელირება, და მეთოდის პროგნოზირება საცნობარო კლასებზე დაყრდნობით. პროგნოზირების პრინციპების ვებსაიტზე (www.forecastingprinciples.com) მოცემულია მეთოდების მიმოხილვა მეთოდოლოგიურ ხეში, ძირითადად გამოყოფს სუბიექტურ მეთოდებს (მაგ. მეთოდებს, რომლებიც გამოიყენება არასაკმარისი მონაცემების რაოდენობრივად შესაფასებლად) და სტატიკურ მეთოდებს (მაგ. მეთოდებს, რომლებიც გამოიყენება შესაბამისი რიცხვითი მონაცემების გამოყენებისას). . ამ სტატიაში ყურადღებას გავამახვილებ დროის სერიების პროგნოზირებაზე, სტატიკური მიდგომის სახეობაზე, რომლის დროსაც დაგროვილი მონაცემები საკმარისია ინდიკატორების პროგნოზირებისთვის.

დროის სერიების პროგნოზირება ვარაუდობს, რომ წარსულში მიღებული მონაცემები ხელს უწყობს მომავალში მნიშვნელობების ახსნას. მნიშვნელოვანია გვესმოდეს, რომ ზოგიერთ შემთხვევაში საქმე გვაქვს დეტალებთან, რომლებიც არ არის ასახული დაგროვილ მონაცემებში. მაგალითად, გაჩნდება ახალი კონკურენტი, რომელიც შეიძლება უარყოფითად იმოქმედოს მომავალ შემოსავალზე ან სამუშაო ძალის შემადგენლობის სწრაფ ცვლილებებზე, რამაც შეიძლება გავლენა მოახდინოს უმუშევრობის მაჩვენებლებზე. ასეთ სიტუაციებში დროის სერიების პროგნოზირება არ შეიძლება იყოს ერთადერთი მიდგომა. ხშირად პროგნოზირების სხვადასხვა მიდგომები გაერთიანებულია ყველაზე ზუსტი პროგნოზების უზრუნველსაყოფად.

დროის სერიების პროგნოზირების საფუძვლების გააზრება

დროის სერია არის მნიშვნელობების ერთობლიობა, რომელიც მიღებულია გარკვეული პერიოდის განმავლობაში, ჩვეულებრივ, რეგულარული ინტერვალებით. გავრცელებული მაგალითებია ყოველკვირეული გაყიდვები, კვარტალური ხარჯები და ყოველთვიური უმუშევრობის მაჩვენებლები. დროის სერიების მონაცემები წარმოდგენილია გრაფიკულ ფორმატში, დროის ინტერვალით ნაკვეთის x ღერძის გასწვრივ და მნიშვნელობებით y ღერძის გასწვრივ, როგორც ნაჩვენებია სურათზე 1.

როდესაც ხედავთ, თუ როგორ იცვლება მნიშვნელობა ერთი პერიოდიდან მეორეში და როგორ ხდება მნიშვნელობების პროგნოზირება, უნდა გვახსოვდეს, რომ დროის სერიების მონაცემებს აქვს რამდენიმე მნიშვნელოვანი მახასიათებელი.

  • საბაზისო დონე. საბაზისო ჩვეულებრივ განისაზღვრება, როგორც დროის სერიების საშუალო. ზოგიერთ პროგნოზირების მოდელში, საბაზისო ჩვეულებრივ განისაზღვრება, როგორც სერიის მონაცემების საწყისი მნიშვნელობა.
  • ტრენდი (Trend). ტენდენცია ზოგადად აჩვენებს, თუ როგორ იცვლება დროის სერია ერთი პერიოდიდან მეორეზე. 1-ელ სურათზე ნაჩვენები მაგალითში უმუშევართა რაოდენობა იზრდება 2008 წლის დასაწყისიდან 2010 წლის იანვრამდე, რის შემდეგაც ტენდენციის ხაზი მცირდება. ამ სტატიის დიაგრამების ასაგებად გამოყენებული მონაცემთა ნიმუშის შესახებ ინფორმაცია შეგიძლიათ იხილოთ გვერდითა ზოლში "უმუშევრობის დონის გამოთვლა".
  • სეზონური რყევები. ზოგიერთი მნიშვნელობის ტენდენცია იზრდება ან ეცემა გარკვეული პერიოდის მიხედვით, როგორიცაა კვირის დღე ან წელიწადის თვე. განვიხილოთ საცალო გაყიდვების მაგალითი, რომელიც ხშირად პიკს აღწევს საშობაო სეზონზე. უმუშევრობის შემთხვევაში, ჩვენ ვხედავთ სეზონურ ტენდენციას იანვარსა და ივლისში მწვერვალებით და მაისსა და ოქტომბერში დაბალია, როგორც სურათი 2 გვიჩვენებს.
  • ხმაური. ზოგიერთი პროგნოზირების მოდელი მოიცავს მეოთხე მახასიათებელს, ხმაურს ან შეცდომას, რაც ეხება შემთხვევით რყევებს და არაერთგვაროვან მოძრაობებს მონაცემებში. ხმაური აქ არ განიხილება.

ამრიგად, ტენდენციის იდენტიფიცირებით, ტენდენციის ხაზის საბაზისო ხაზზე გადაფარვით და სეზონური კომპონენტის იდენტიფიცირებით, რომელიც შეიძლება იყოს მონაცემთა ანალიზში, თქვენ გაქვთ პროგნოზირებადი მოდელი, რომელიც შეიძლება გამოყენებულ იქნას მნიშვნელობების პროგნოზირებისთვის:

პროგნოზირებული მნიშვნელობა = საბაზისო + ტენდენცია + სეზონური

საბაზისო დონის და ტენდენციის განსაზღვრა

საბაზისო მნიშვნელობისა და ტენდენციის განსაზღვრის ერთადერთი გზა არის რეგრესიის მეთოდის გამოყენება. სიტყვა „რეგრესია“ აქ აღნიშნავს ცვლადებს შორის ურთიერთობის განხილვას. ამ შემთხვევაში, არსებობს კავშირი დროის დამოუკიდებელ ცვლადსა და უმუშევართა რაოდენობის დამოკიდებულ ცვლადს შორის. გაითვალისწინეთ, რომ დამოუკიდებელ ცვლადს ზოგჯერ პროგნოზირებადსაც უწოდებენ.

გამოიყენეთ ინსტრუმენტი, როგორიცაა Microsoft Excel, რეგრესიის მეთოდის გამოსაყენებლად. მაგალითად, შეგიძლიათ განახორციელოთ ავტომატური გამოთვლა Excel-ში და დაამატოთ ტრენდის ხაზი დროის სერიის ნახაზზე Trendline მენიუს გამოყენებით Chart Tools Layout ჩანართში ან PivotChart Tools Layout ჩანართზე Excel 2010 ან Excel 2007 პანელში. სურათზე 1, I. დაამატა სწორი ტრენდის ხაზი Trendline მენიუში Mode Linear trendline-ის არჩევით. შემდეგ მე ავირჩიე More Trendline Options Trendline მენიუდან, შემდეგ კი ჩვენების განტოლება დიაგრამაზე და ჩვენება R-კვადრატის მნიშვნელობა დიაგრამის ვარიანტებზე, იხილეთ სურათი 3.

სურათი 3: ტენდენციის პარამეტრები Excel-ში

ტენდენციის ხაზის დაგროვებულ მონაცემებზე მორგების პროცესს ხაზოვანი რეგრესია ეწოდება. როგორც 1 ეკრანზე ვხედავთ, ტრენდის ხაზი გამოითვლება განტოლების მიხედვით, სადაც განისაზღვრება საბაზისო დონე (8248.8) და ტენდენცია (104.67x):

y = 104.67x + 8248.8

თქვენ შეგიძლიათ წარმოიდგინოთ ტრენდის ხაზი, როგორც დაკავშირებული x-y კოორდინატების სერია, სადაც შეგიძლიათ შეაერთოთ დროის მონაკვეთი (ანუ x-ღერძი) მნიშვნელობის მისაღებად (y-ღერძი). Excel განსაზღვრავს "საუკეთესო" ტრენდულ ხაზს უმცირესი კვადრატების მეთოდის გამოყენებით (განსაზღვრულია როგორც R² სურათზე 1). უმცირესი კვადრატების ხაზი არის ხაზი, რომელიც ამცირებს კვადრატულ ვერტიკალურ მანძილს ტრენდის ხაზის თითოეული წერტილიდან ხაზის შესაბამის წერტილამდე. RMS მნიშვნელობები საშუალებას გაძლევთ განსაზღვროთ, რომ გადახრები ფაქტობრივი ხაზის ზემოთ ან ქვემოთ არ აბალანსებს ერთმანეთს. ეკრანზე 1, ჩვენ ვხედავთ, რომ R² = 0,5039, რაც ნიშნავს, რომ წრფივი ურთიერთობა ხსნის უმუშევრობის სტატისტიკის ცვლილებების 50,39%-ს დროთა განმავლობაში.

Excel-ში ზუსტი ტენდენციის ხაზის განსაზღვრა ხშირად მოიცავს ცდას და შეცდომებს, ვიზუალურ შემოწმებასთან ერთად. ეკრანზე 1, სწორი ტრენდის ხაზი არ არის საუკეთესო მორგება. Excel გთავაზობთ ტრენდის ხაზის სხვა ვარიანტებს, რომლებსაც ხედავთ სურათზე 3. სურათზე 4, მე დავამატე ოთხი პერიოდის მოძრავი საშუალო ხაზი, რომელიც დაფუძნებულია დროის სერიების მიმდინარე და ბოლო კომპლექტის პერიოდების არითმეტიკულ საშუალოზე.

ასევე, მე დავამატე პოლინომიური ტრენდის ხაზი ალგებრული განტოლების გამოყენებით წრფის გამოსათვლელად. გაითვალისწინეთ, რომ პოლინომიური ტრენდის ხაზს აქვს R² მნიშვნელობა 0,9318, რომელიც განსაზღვრავს საუკეთესო თანაფარდობას დამოუკიდებელ და დამოკიდებულ ცვლადებს შორის ურთიერთობის გამოხატვისას. თუმცა, უფრო მაღალი R² სულაც არ ნიშნავს იმას, რომ ტრენდის ხაზი უზრუნველყოფს პროგნოზირებულ მნიშვნელობას. არსებობს ზუსტი პროგნოზების გამოთვლის სხვა მეთოდებიც, რომლებსაც ქვემოთ მოკლედ აღვწერ. Excel-ში ტრენდული ხაზის ზოგიერთი ვარიანტი (მაგალითად, ხაზოვანი, პოლინომიური ტენდენციების ხაზები) საშუალებას გაძლევთ გააკეთოთ პროგნოზები როგორც წინ, ასევე უკან, პერიოდების რაოდენობის გათვალისწინებით, მიღებული მნიშვნელობების გრაფიკზე გამოსახვით. ზოგიერთს შეიძლება უცნაურად მოეჩვენოს გამოთქმა „პროგნოზი საპირისპირო მიმართულებით“. უმჯობესია ამის წარმოდგენა მაგალითით. დავუშვათ, რომ ახალმა ფაქტორმა - საჯარო სექტორში სამუშაო ადგილების სწრაფმა ზრდამ (მაგ., სამუშაოები სამშობლოს დაცვაში 2000-იანი წლების დასაწყისში, დროებითი მუშები აშშ-ს აღწერის ბიუროში) - გამოიწვია უმუშევრობის დონის სწრაფი ვარდნა. თქვენ უნდა დააპროექტოთ ახალი სამუშაო სექტორის ზრდის ტემპი უკან რამდენიმე თვის განმავლობაში, შემდეგ კი ხელახლა გამოთვალოთ უმუშევრობის დონე, რათა მიაღწიოთ ცვლილების შერბილებულ ტემპს.

თქვენ ასევე შეგიძლიათ ხელით გამოიყენოთ ტრენდის ხაზის განტოლება მომავალი მნიშვნელობების გამოსათვლელად. მე-5 სურათზე დავამატე პოლინომიური ტენდენციის ხაზი 6-თვიანი პროგნოზით, პირველად ამოვიღე ბოლო 6 თვე (ანუ 2012 წლის აპრილიდან სექტემბრამდე) თავდაპირველი დროის სერიიდან.

თუ შევადარებთ ეკრანს 5 ეკრანს 1-ს, ხედავთ, რომ პოლინომიურ პროგნოზებს აქვთ აღმავალი ტენდენცია, რომელიც არ შეესაბამება ფაქტობრივი დროის სერიების დაღმავალ ტენდენციას (ტენდენციას).

რეგრესიასთან დაკავშირებით ორი მნიშვნელოვანი პუნქტია გასათვალისწინებელი.

  • როგორც ზემოთ აღინიშნა, წრფივი რეგრესია მოიცავს ერთ დამოუკიდებელ და ერთ დამოკიდებულ ცვლადს. იმის გასაგებად, თუ როგორ შეიძლება ახსნას დამატებითი დამოუკიდებელი ცვლადები დამოკიდებული ცვლადის ცვლილებებს, სცადეთ მრავალჯერადი რეგრესიის მოდელის შექმნა. შეერთებულ შტატებში უმუშევართა რაოდენობის პროგნოზირების კონტექსტში, შეგიძლიათ გაზარდოთ R² (და პროგნოზის სიზუსტე) ეკონომიკის ზრდის ტემპის, აშშ-ს მოსახლეობის და დასაქმებული მუშაკების რაოდენობის ზრდის გათვალისწინებით. . SSAS-ს შეუძლია მრავალი ცვლადის (ანუ რეგრესორების) მორგება დროის სერიების პროგნოზირების მოდელში.
  • დროის სერიების პროგნოზირების ალგორითმები, მათ შორის SSAS-ში გამოყენებული, ითვლის ავტოკორელაციას, რომელიც არის კორელაცია მეზობელ მნიშვნელობებს შორის დროის სერიაში. პროგნოზირების მოდელს, რომელიც უშუალოდ მოიცავს ავტოკორელაციას, ეწოდება ავტორეგრესიული (AR) მოდელი. მაგალითად, წრფივი რეგრესიის მოდელი აშენებს ტენდენციის განტოლებას პერიოდის საფუძველზე (მაგალითად, 104.67 * x), ხოლო AR მოდელი აშენებს განტოლებას წინა მნიშვნელობებზე დაყრდნობით (მაგალითად, -0.417 * უმუშევარი (-1) + 0,549 * დასაქმებული (-ერთი)). AR მოდელი პოტენციურად ზრდის პროგნოზის სიზუსტეს, რადგან ის ითვალისწინებს დამატებით ინფორმაციას ტრენდისა და სეზონური კომპონენტის მიღმა.

სეზონური კომპონენტის გათვალისწინებით

სეზონური კომპონენტი დროის სერიების სტრუქტურაში, როგორც წესი, ჩნდება ან კვირის დღეს, ან თვის დღეს, ან წელიწადის თვესთან დაკავშირებით. როგორც ზემოთ აღინიშნა, აშშ-ში უმუშევართა რიცხვი, როგორც წესი, იზრდება და მცირდება მოცემულ კალენდარულ წელს. ეს ასეა მაშინაც კი, როცა ეკონომიკა იზრდება, როგორც ეს ნაჩვენებია სურათზე 2. სხვა სიტყვებით რომ ვთქვათ, ზუსტი პროგნოზის გასაკეთებლად, თქვენ უნდა გაითვალისწინოთ სეზონური კომპონენტი. ერთი გავრცელებული მიდგომაა სეზონურად მორგებული მეთოდის გამოყენება. In Practical Time Series Forecasting: A Hands-On Guide, Second Edition (CreateSpace Independent Publishing Platform, 2012), ავტორი გალიტ შმუელი გირჩევთ გამოიყენოთ სამი მეთოდიდან ერთ-ერთი:

  • მოძრავი საშუალო გაანგარიშება;
  • დროის სერიების ანალიზი ნაკლებად დეტალურ დონეზე (მაგალითად, განიხილეთ ცვლილებები უმუშევართა რაოდენობაში კვარტალურად და არა ყოველთვიურად);
  • ცალკეული დროის სერიების ანალიზი (და პროგნოზების გამოთვლა) სეზონების მიხედვით.

საბაზისო დონე და ტენდენცია განისაზღვრება პროგნოზის გაანგარიშებისას, გათლილი დროის სერიების გათვალისწინებით. სურვილისამებრ, სეზონური კომპონენტი ან კორექტირება შეიძლება ხელახლა იქნას გამოყენებული საპროგნოზო მნიშვნელობებზე, სეზონური ფაქტორის საწყისი მნიშვნელობების გათვალისწინებით Holt-Winters მეთოდით მუშაობისას. თუ გსურთ ნახოთ, თუ როგორ ხდება სეზონური გამოთვლები Excel-ში, ჩაწერეთ "Winters მეთოდი Excel-ში" ინტერნეტის საძიებო ზოლში. ჰოლტ-ვინტერსის მეთოდის გაფართოებული ახსნისთვის იხილეთ Wayne L. Winston Microsoft Office Excel 2007: მონაცემთა ანალიზი და ბიზნეს მოდელირება, მეორე გამოცემა (Microsoft Press, 2007).

მონაცემთა მოპოვების ბევრ პაკეტში, როგორიცაა SSAS, დროის სერიების პროგნოზირების ალგორითმები ავტომატურად ითვალისწინებენ სეზონურ რყევებს სეზონური ურთიერთობების გაზომვით და მათი პროგნოზირების მოდელში ჩართვით. თუმცა, შეგიძლიათ დააინსტალიროთ მინიშნებები სეზონური ცვლილებების სტრუქტურის შესახებ.

პროგნოზირების მოდელის გაზომვის სიზუსტე

როგორც უკვე აღვნიშნეთ, ორიგინალური მოდელი (თუ გამოყენებულია უმცირესი კვადრატების მეთოდი) სულაც არ უზრუნველყოფს პროგნოზების სიზუსტეს. პროგნოზირებადი შეფასებების სიზუსტის შესამოწმებლად საუკეთესო გზაა დროის სერიების დაყოფა ორ მონაცემთა ნაკრებად: ერთი მოდელის შესაქმნელად (ანუ სასწავლო) და მეორე ვალიდაციისთვის. ვალიდაციის მონაცემთა ნაკრები იქნება შეყვანის მონაცემთა ნაკრების უახლესი ნაწილი და ის იდეალურად მოიცავს დროის ჩარჩოს, რომელიც უდრის მომავალი პროგნოზის ვადებს. მოდელის შესამოწმებლად (დასამოწმებლად), პროგნოზირებული მნიშვნელობები შედარებულია რეალურ მნიშვნელობებთან. გაითვალისწინეთ, რომ დადასტურების შემდეგ, მოდელი შეიძლება გადაკეთდეს მთელი დროის სერიების გამოყენებით, ამიტომ სასურველია გამოიყენოთ უახლესი რეალური მნიშვნელობები მომავალი მნიშვნელობების პროგნოზირებისთვის.

პროგნოზირებადი მოდელის სიზუსტის გაზომვისას, როგორც წესი, ჩნდება ორი კითხვა: როგორ განვსაზღვროთ პროგნოზირებადი შეფასების სიზუსტე და რამდენი ისტორიული მონაცემი გამოვიყენოთ მოდელის მოსამზადებლად.

როგორ განვსაზღვროთ პროგნოზირებადი შეფასების სიზუსტე? ზოგიერთ სცენარში, რეალური მნიშვნელობების ზემოთ პროგნოზირებული ღირებულებები შეიძლება არ იყოს სასურველი (მაგალითად, საინვესტიციო პროგნოზებში). სხვა სიტუაციებში, რეალურზე დაბალი პროგნოზირებადი მნიშვნელობები შეიძლება იყოს დამღუპველი (მაგალითად, აუქციონის საქონლის გამარჯვებული ფასების ყველაზე დაბალი პროგნოზირება). მაგრამ იმ შემთხვევებში, როდესაც გსურთ გამოთვალოთ შეფასება ყველა პროგნოზისთვის (საპროგნოზო მნიშვნელობები უფრო მაღალია თუ დაბალი ვიდრე რეალურ მნიშვნელობებზე), შეგიძლიათ დაიწყოთ შეცდომის რაოდენობრივი განსაზღვრით ერთ პროგნოზში განმარტების გამოყენებით:

შეცდომა = პროგნოზირებული მნიშვნელობა - ფაქტობრივი მნიშვნელობა

შეცდომის ამ განმარტებით, არსებობს სიზუსტის გაზომვის ორი ყველაზე პოპულარული მეთოდი: ეს არის საშუალო აბსოლუტური შეცდომა, ანუ საშუალო აბსოლუტური შეცდომა (MAE) და საშუალო აბსოლუტური პროცენტული შეცდომა, ან საშუალო აბსოლუტური პროცენტული შეცდომა (MAPE). MAE მეთოდში პროგნოზირების შეცდომების აბსოლუტური მნიშვნელობები ჯამდება და შემდეგ იყოფა პროგნოზების საერთო რაოდენობაზე. MAPE მეთოდი ითვლის საშუალო აბსოლუტურ გადახრას პროგნოზიდან პროცენტებში. ამ და სხვა მეთოდების გამოყენების მაგალითები პროგნოზირებადი შეფასებების ხარისხის გასაზომად, Excel-ის შაბლონი (წინასწარმეტყველური მონაცემების ნიმუში და სიზუსტის ფაქტორებით) შეგიძლიათ იხილოთ მოთხოვნის მეტრიკის დიაგნოსტიკის შაბლონის ვებ გვერდზე (demandplanning.net/DemandMetricsExcelTemp.htm ).

რამდენი ისტორიული მონაცემი უნდა იყოს გამოყენებული მოდელის მოსამზადებლად? დროის სერიებთან მუშაობისას, რომელსაც აქვს ხანგრძლივი ისტორია, შეიძლება დაგჭირდეთ მოდელში ყველა ისტორიული მონაცემის ჩართვა. თუმცა, ზოგჯერ დამატებითი ისტორია არ აუმჯობესებს პროგნოზის სიზუსტეს. ისტორიულ მონაცემებს შეუძლია პროგნოზის დამახინჯებაც კი, თუ წარსული პირობები მნიშვნელოვნად განსხვავდება აწმყოსგან (მაგალითად, სამუშაო ძალის შემადგენლობა ახლა და წარსულში განსხვავებულია). მე არ შემხვედრია რაიმე კონკრეტული ფორმულა ან პრაქტიკული მეთოდი, რომელიც მიგვითითებს იმაზე, თუ რამდენი ისტორიული მონაცემი უნდა შევიტანო, ამიტომ გირჩევთ, დავიწყოთ დროის სერიებით, რომლებიც რამდენჯერმე აღემატება საპროგნოზო დროის ინტერვალებს და შემდეგ შეამოწმოთ სიზუსტე. შემდეგი, სცადეთ ისტორიის ნომრის დამრგვალება ზემოთ ან ქვემოთ და კვლავ შეამოწმეთ.

დროის სერიების პროგნოზირება SSAS-ში

დროის სერიების პროგნოზირება პირველად SSAS-ში 2005 წელს გამოჩნდა. წინასწარმეტყველური მნიშვნელობების გამოსათვლელად, Microsoft Time Series ალგორითმი გამოიყენა ერთი ალგორითმი, რომელსაც ეწოდება ავტორეგრესიული ხე ჯვარედინი პროგნოზით (ARTXP), ან ავტორეგრესიული ხე ჯვარედინი პროგნოზით. ARTXP აერთიანებს ავტორეგრესიას გადაწყვეტილების ხის მონაცემთა მოპოვებასთან ისე, რომ პროგნოზირების განტოლება შეიძლება შეიცვალოს (იგულისხმება გაყოფა) გარკვეული კრიტერიუმების საფუძველზე. მაგალითად, პროგნოზირების მოდელი უზრუნველყოფს უკეთეს მორგებას (და უფრო დიდ პროგნოზის სიზუსტეს), თუ ჯერ გაყოფთ თარიღის მიხედვით და შემდეგ დამოუკიდებელი ცვლადის მნიშვნელობით, როგორც ნაჩვენებია სურათზე 6.


სურათი 6: ARTXP გადაწყვეტილების ხის მაგალითი SSAS-ში

SSAS 2008 წელს, Microsoft Time Series ალგორითმმა დაიწყო ალგორითმის გამოყენება, რომელსაც ეწოდება ავტორეგრესიული ინტეგრირებული მოძრავი საშუალო (ARIMA), გარდა ARTXP-ისა, გრძელვადიანი პროგნოზების გამოსათვლელად. ARIMA ითვლება ინდუსტრიის სტანდარტად და შეიძლება ჩაითვალოს, როგორც ავტორეგრესიული პროცესების და მოძრავი საშუალო მოდელების კომბინაცია. გარდა ამისა, იგი აანალიზებს ისტორიული პროგნოზის შეცდომებს მოდელის გასაუმჯობესებლად.

ნაგულისხმევად, Microsoft Time Series ალგორითმი აერთიანებს ARIMA და ARTXP ალგორითმების შედეგებს ოპტიმალური პროგნოზების მისაღწევად. თუ გსურთ, შეგიძლიათ გამორთოთ ეს ფუნქცია. მოდით შევხედოთ SQL Server Books Online (BOL) დოკუმენტაციას:

„ალგორითმი ავარჯიშებს ერთი და იმავე მონაცემების ორ განსხვავებულ მოდელს: ერთი მოდელი იყენებს ARTXP ალგორითმს, ხოლო მეორე იყენებს ARIMA ალგორითმს. შემდეგ ალგორითმი აერთიანებს ორი მოდელის შედეგებს, რათა განავითაროს საუკეთესო პროგნოზი, რომელიც მოიცავს დროის მონაკვეთების ცვლადი რაოდენობას. ვინაიდან ARTXP ალგორითმი უფრო შესაფერისია მოკლევადიანი პროგნოზებისთვის, სასურველია მისი გამოყენება პროგნოზების სერიის დასაწყისში. თუმცა, თუ პროგნოზირებისთვის საჭირო დროის მონაკვეთები გადადის მომავალში, ARIMA ალგორითმი უფრო მნიშვნელოვანი იქნება.

SSAS-ში დროის სერიების პროგნოზირებასთან მუშაობისას ყოველთვის უნდა გახსოვდეთ შემდეგი:

  • მიუხედავად იმისა, რომ SSAS-ს აქვს მაინინგის სიზუსტის დიაგრამის ჩანართი, ის არ მუშაობს მონაცემთა მაინინგით დროის სერიების მოდელებისთვის. შედეგად, თქვენ ხელით უნდა გაზომოთ სიზუსტე აქ ნახსენები ერთ-ერთი მეთოდის გამოყენებით (მაგალითად, MAE, MAPE) გამოსათვლელად ისეთი ხელსაწყოს გამოყენებით, როგორიცაა Excel.
  • SSAS Enterprise Edition საშუალებას გაძლევთ დაყოთ ერთი დროის სერია მრავალ " ისტორიული მოდელებიისე, რომ არ დაგჭირდეთ მონაცემების ხელით დაყოფა მონაცემთა ნაკრებებად მოდელის მომზადებისა და ვალიდაციისთვის, წინასწარმეტყველების სიზუსტის შესამოწმებლად. საბოლოო მომხმარებლის თვალსაზრისით, არსებობს მხოლოდ ერთი დროის სერიების მოდელი, მაგრამ თქვენ შეგიძლიათ შეადაროთ რეალური შედეგები მოდელის პროგნოზირებულ შედეგებს, როგორც ეს 7-ე მონაცემებს აჩვენებს.

Შემდეგი ნაბიჯი

ამ სტატიაში მე გაგაცნოთ დროის სერიების პროგნოზირების საფუძვლები. ჩვენ ასევე განვიხილეთ ძირითადი ალგორითმების ზოგიერთი დეტალი, რათა ისინი არ გახდეს დაბრკოლება დროის სერიების დამუშავებაში. როგორც შემდეგი ნაბიჯი, მე გთავაზობთ დაეუფლონ დროის სერიების პროგნოზირების ხელსაწყოებს SSAS-ით. პროექტი, რომელიც იყენებს ამ სტატიაში მოცემულ უმუშევრობის მონაცემებს, შეიძლება გახდეს მოდელი. ამის შემდეგ შეგიძლიათ გაეცნოთ TechNet-ის ელექტრონულ გაკვეთილს „მონაცემთა მოპოვების შუალედური სახელმძღვანელო (ანალიზის სერვისები - მონაცემთა მოპოვება)“ მისამართზე technet.microsoft.com/en-us/library /cc879271.aspx.

რატომ არის მონაცემთა მოპოვება ასე არაპოპულარული

ბოლო ათწლეულში ფართოდ გამოიყენება ბიზნეს ინტელექტის (BI) ტექნოლოგიები, როგორიცაა OLAP. ამავდროულად, Microsoft ახორციელებს სხვა BI ტექნოლოგიას, მონაცემთა მოპოვებას, პოპულარულ ინსტრუმენტებში, როგორიცაა Microsoft SQL Server და Microsoft Excel. თუმცა, მონაცემთა მოპოვების ტექნოლოგია ჯერ კიდევ არ გახდა ლიდერი. რატომ? მიუხედავად იმისა, რომ ადამიანების უმეტესობას შეუძლია სწრაფად გაითავისოს მონაცემთა მოპოვების ძირითადი ცნებები, ალგორითმების ძირითადი დეტალები განუყოფლად არის დაკავშირებული მათემატიკურ ცნებებთან და ფორმულებთან. აბსტრაქტული გაგების მაღალ დონესა და დეტალურ შესრულებას შორის დიდი „განსხვავებაა“. შედეგად, მონაცემთა მაინინგი განიხილება, როგორც „შავი ყუთი“ IT პროფესიონალებისა და ინდუსტრიული მომხმარებლების მიერ, რაც ხელს არ უწყობს ტექნოლოგიის ფართო ათვისებას. ეს სტატია არის ჩემი მცდელობა, შევამცირო „განსხვავება“ დროის სერიების პროგნოზირებაში.

უმუშევრობის დონის გაანგარიშება

მთავარ სტატიაში, გრაფიკების მონაცემები ეყრდნობა მშრომელი მოსახლეობის შესახებ ინფორმაციას, რომელიც გამოქვეყნებულია U.S. შრომის სტატისტიკის ბიურო (http://www.bls.gov/). BLS აქვეყნებს უმუშევრობის მაჩვენებლებს აშშ-ს აღწერის ბიუროს (BLS) მიერ ჩატარებულ ყოველთვიურ გამოკითხვაზე დაყრდნობით, რომელიც ასახავს დასაქმებულთა და უმუშევართა საერთო რაოდენობას. კერძოდ, BLS იყენებს ფორმულას:

უმუშევრობის დონე = უმუშევარი/(უმუშევარი + დასაქმებული)

აღსანიშნავია, რომ რაც შეეხება უმუშევრობის დონეს, მედია ჩვეულებრივ სეზონურად კორექტირებულ კოეფიციენტს იძლევა. სეზონური კორექტირება ხორციელდება ჩვეულებრივი მოდელის გამოყენებით, რომელსაც ეწოდება ავტორეგრესიული ინტეგრირებული მოძრავი საშუალო (ARIMA). ეს არსებითად იგივე ალგორითმია, რომელსაც იყენებს მონაცემთა მოპოვების მრავალი პაკეტი დროის სერიების პროგნოზირებისთვის, მათ შორის SQL Server Analysis Services (SSAS). მეტის მისაღებად დეტალური ინფორმაცია BLS-ის მიერ გამოყენებული ARIMA მოდელისთვის ეწვიეთ X-12-ARIMA სეზონური რეგულირების პროგრამის ვებგვერდს (www.census.gov/srd/www/x12a/). გთხოვთ გაითვალისწინოთ, რომ ში სტანდარტული პროექტიამ სტატიისთვის მე გამოვიყენე მორგებული მნიშვნელობები სეზონური და არასეზონური რყევებისთვის.


დროის სერიების პროგნოზირების დაუფლება


წინა სამ შენიშვნაში აღწერილია რეგრესიის მოდელები, რომლებიც პროგნოზირებენ პასუხს განმარტებითი ცვლადების მნიშვნელობებიდან. ამ ჩანაწერში ჩვენ გაჩვენებთ, თუ როგორ გამოვიყენოთ ეს მოდელები და სხვა სტატისტიკური მეთოდები თანმიმდევრული დროის ინტერვალებით შეგროვებული მონაცემების გასაანალიზებლად. სცენარში აღნიშნული თითოეული კომპანიის მახასიათებლების მიხედვით განვიხილავთ დროის სერიების ანალიზის სამ ალტერნატიულ მიდგომას.

მასალა ილუსტრირებული იქნება მაგალითით: სამი კომპანიის შემოსავლის პროგნოზირება. წარმოიდგინეთ, რომ თქვენ ხართ ანალიტიკოსი მსხვილ ფინანსურ კომპანიაში. თქვენი კლიენტების საინვესტიციო პერსპექტივების შესაფასებლად, თქვენ უნდა წინასწარ განსაზღვროთ სამი კომპანიის მოგება. ამისათვის თქვენ შეაგროვეთ მონაცემები თქვენთვის საინტერესო სამი კომპანიის შესახებ - Eastman Kodak, Cabot Corporation და Wal-Mart. ვინაიდან კომპანიები განსხვავდებიან ბიზნესის ტიპის მიხედვით, თითოეულ დროის სერიას აქვს თავისი უნიკალური მახასიათებლები. ამიტომ პროგნოზირებისთვის საჭიროა სხვადასხვა მოდელების გამოყენება. როგორ ავირჩიოთ საუკეთესო პროგნოზირების მოდელი თითოეული კომპანიისთვის? როგორ შევაფასოთ საინვესტიციო პერსპექტივები პროგნოზირების შედეგების საფუძველზე?

დისკუსია იწყება წლიური მონაცემების ანალიზით. დემონსტრირებულია ასეთი მონაცემების გათანაბრების ორი მეთოდი: მოძრავი საშუალო და ექსპონენციალური დაგლუვება. შემდეგ აჩვენებს ტენდენციის გამოთვლის პროცედურას უმცირესი კვადრატების მეთოდისა და უფრო მოწინავე პროგნოზირების მეთოდების გამოყენებით. და ბოლოს, ეს მოდელები გაფართოვდა დროის სერიებზე, ყოველთვიური ან კვარტალური მონაცემების საფუძველზე.

ჩამოტვირთეთ შენიშვნა ფორმატში ან ფორმატში, მაგალითები ფორმატში

პროგნოზირება ბიზნესში

იმის გამო, რომ ეკონომიკური პირობები დროთა განმავლობაში იცვლება, მენეჯერებმა უნდა განჭვრიტონ რა გავლენას მოახდენს ეს ცვლილებები მათ კომპანიაზე. ზუსტი დაგეგმვის უზრუნველსაყოფად ერთ-ერთი მეთოდი პროგნოზირებაა. მიუხედავად შემუშავებული მეთოდების დიდი რაოდენობისა, ისინი ყველა ერთსა და იმავე მიზანს ატარებენ - იწინასწარმეტყველონ მოვლენები, რომლებიც მომავალში მოხდება, რათა გაითვალისწინონ ისინი კომპანიის განვითარების გეგმებისა და სტრატეგიების შემუშავებისას.

თანამედროვე საზოგადოება მუდმივად განიცდის პროგნოზირების საჭიროებას. მაგალითად, სწორი პოლიტიკის შემუშავებისთვის, მთავრობის წევრებმა უნდა იწინასწარმეტყველონ უმუშევრობის დონე, ინფლაცია, სამრეწველო წარმოება, ფიზიკური და კორპორაციის საშემოსავლო გადასახადი. აღჭურვილობისა და პერსონალის მოთხოვნების დასადგენად, ავიაკომპანიის დირექტორებმა სწორად უნდა იწინასწარმეტყველონ საჰაერო მოძრაობის მოცულობა. ჰოსტელში საკმარისი სივრცის შესაქმნელად, კოლეჯების ან უნივერსიტეტების ადმინისტრატორებს სურთ იცოდნენ, რამდენი სტუდენტი შევა მათ სასწავლებელში მომავალ წელს.

არსებობს პროგნოზირების ორი ზოგადად მიღებული მიდგომა: ხარისხობრივი და რაოდენობრივი. თვისებრივი პროგნოზირების მეთოდები განსაკუთრებით მნიშვნელოვანია, თუ რაოდენობრივი მონაცემები არ არის ხელმისაწვდომი მკვლევარისთვის. როგორც წესი, ეს მეთოდები ძალიან სუბიექტურია. თუ სტატისტიკოსისთვის ხელმისაწვდომია მონაცემები კვლევის ობიექტის ისტორიის შესახებ, უნდა იქნას გამოყენებული რაოდენობრივი პროგნოზირების მეთოდები. ეს მეთოდები საშუალებას გაძლევთ წინასწარ განსაზღვროთ ობიექტის მდგომარეობა მომავალში მისი წარსულის შესახებ მონაცემების საფუძველზე. რაოდენობრივი პროგნოზირების მეთოდები იყოფა ორ კატეგორიად: დროის სერიების ანალიზი და მიზეზ-შედეგობრივი ანალიზის მეთოდები.

დროის სერიაარის რიცხვითი მონაცემების ერთობლიობა, რომელიც მიღებულია დროის თანმიმდევრულ პერიოდებში. დროის სერიების ანალიზის მეთოდი საშუალებას გაძლევთ იწინასწარმეტყველოთ რიცხვითი ცვლადის მნიშვნელობა მისი წარსულისა და ახლანდელი მნიშვნელობების საფუძველზე. მაგალითად, ყოველდღიური აქციების ფასები ნიუ-იორკის საფონდო ბირჟაზე ქმნიან დროის სერიას. დროის სერიების კიდევ ერთი მაგალითია თვიური ინდექსის მნიშვნელობები სამომხმარებლო ფასები, კვარტალური მთლიანი შიდა პროდუქტი და კომპანიის წლიური გაყიდვების შემოსავალი.

მიზეზ-შედეგობრივი ანალიზის მეთოდებისაშუალებას გაძლევთ განსაზღვროთ რა ფაქტორები მოქმედებს პროგნოზირებული ცვლადის მნიშვნელობებზე. ეს მოიცავს მრავალჯერადი რეგრესიული ანალიზის მეთოდებს ჩამორჩენილი ცვლადებით, ეკონომეტრიული მოდელირება, წამყვანი ინდიკატორების ანალიზი, დიფუზიური ინდექსების ანალიზის მეთოდები და სხვა ეკონომიკური ინდიკატორები. ჩვენ მხოლოდ დროის ანალიზზე დაფუძნებულ პროგნოზირების მეთოდებზე ვისაუბრებთ. x რიგები.

კლასიკური მულტიპლიკაციური დროის მოდელის კომპონენტები x რიგები

ძირითადი დაშვება, რომელიც საფუძვლად უდევს დროის სერიების ანალიზს, ასეთია: ფაქტორები, რომლებიც გავლენას ახდენენ შესასწავლ ობიექტზე აწმყოსა და წარსულში, ასევე იმოქმედებს მასზე მომავალში. ამრიგად, დროის სერიების ანალიზის ძირითადი მიზნებია პროგნოზირებისთვის მნიშვნელოვანი ფაქტორების იდენტიფიცირება და ხაზგასმა. ამ მიზნის მისაღწევად მრავალი მათემატიკური მოდელი შემუშავდა დროის სერიების მოდელში შემავალი კომპონენტების რყევების შესასწავლად. ალბათ ყველაზე გავრცელებულია კლასიკური მულტიპლიკაციური მოდელი წლიური, კვარტალური და თვიური მონაცემებისთვის. კლასიკური მულტიპლიკაციური დროის სერიების მოდელის საჩვენებლად, გაითვალისწინეთ მონაცემები კომპანიის ფაქტობრივი შემოსავლის შესახებ Wm.Wrigley Jr. კომპანია 1982 წლიდან 2001 წლამდე პერიოდისთვის (ნახ. 1).

ბრინჯი. 1. Wm.Wrigley Jr.-ის რეალური მთლიანი შემოსავლის გრაფიკი. კომპანია (მილიონი დოლარი მიმდინარე ფასებში) 1982 წლიდან 2001 წლამდე

როგორც ხედავთ, 20 წლის განმავლობაში კომპანიის ფაქტობრივ მთლიან შემოსავალს მზარდი ტენდენცია ჰქონდა. ამ გრძელვადიან ტენდენციას ეწოდება ტენდენცია. ტენდენციაარ არის დროის სერიების ერთადერთი კომპონენტი. გარდა ამისა, მონაცემებს აქვს ციკლური და არარეგულარული კომპონენტები. ციკლური კომპონენტიაღწერს მონაცემების მერყეობას მაღლა და ქვევით, რომელიც ხშირად დაკავშირებულია ბიზნეს ციკლებთან. მისი სიგრძე 2-დან 10 წლამდე მერყეობს. ციკლური კომპონენტის ინტენსივობა ან ამპლიტუდა ასევე არ არის მუდმივი. ზოგიერთ წლებში, მონაცემები შეიძლება იყოს უფრო მაღალი ვიდრე ტენდენციის მიერ პროგნოზირებული მნიშვნელობა (ანუ იყოს ციკლის პიკთან ახლოს), ხოლო სხვა წლებში შეიძლება იყოს უფრო დაბალი (ანუ იყოს ციკლის ბოლოში). ნებისმიერ დაკვირვებულ მონაცემს, რომელიც არ დევს ტენდენციის მრუდზე და არ ექვემდებარება ციკლურ ურთიერთობას, ეწოდება არარეგულარული ან შემთხვევითი კომპონენტები. თუ მონაცემები ჩაიწერება ყოველდღიურად ან კვარტალში, არის დამატებითი კომპონენტი, რომელსაც ე.წ სეზონური. ეკონომიკური გამოყენებისთვის დამახასიათებელი დროის სერიების ყველა კომპონენტი ნაჩვენებია ნახ. 2.

ბრინჯი. 2. დროის სერიაზე მოქმედი ფაქტორები

კლასიკური მულტიპლიკაციური დროის სერიების მოდელი ამბობს, რომ ნებისმიერი დაკვირვებული მნიშვნელობა არის ჩამოთვლილი კომპონენტების პროდუქტი. თუ მონაცემები წლიურია, დაკვირვება მეშესაბამისი მეწელი, გამოიხატება განტოლებით:

(1) Y i = თ ი* C i* მე მე

სადაც თ ი- ტენდენციის ღირებულება, C i მეწელი, მე მე მე-წელი.

თუ მონაცემები იზომება ყოველთვიურად ან კვარტალურად, დაკვირვება Y i, რომელიც შეესაბამება i-ე პერიოდს, გამოიხატება განტოლებით:

(2) Y i = T i *S i *C i *I i

სადაც თ ი- ტენდენციის ღირებულება, სი- სეზონური კომპონენტის მნიშვნელობა მე- პერიოდი, C i- ციკლური კომპონენტის მნიშვნელობა მე- პერიოდი, მე მე- შემთხვევითი კომპონენტის მნიშვნელობა მე- პერიოდი.

დროის სერიების ანალიზის პირველ საფეხურზე იკვეთება მონაცემთა გრაფიკი და ვლინდება მათი დამოკიდებულება დროზე. ჯერ უნდა გაარკვიოთ, არის თუ არა მონაცემების გრძელვადიანი ზრდა ან შემცირება (ე.ი. ტენდენცია), თუ დროის სერია მერყეობს ჰორიზონტალური ხაზის გარშემო. თუ ტენდენცია არ არის, მაშინ მოძრავი საშუალოები ან ექსპონენციალური დაგლუვება შეიძლება გამოყენებულ იქნას მონაცემების გასასწორებლად.

დამარბილებელი წლიური დროის სერიები

სცენარში ჩვენ ვახსენეთ Cabot Corporation. მისი სათაო ოფისი მდებარეობს ბოსტონში, მასაჩუსეტსი, სპეციალიზირებულია ქიმიკატების, სამშენებლო მასალების, ჯარიმა ქიმიკატების, ნახევარგამტარების და თხევადი ბუნებრივი აირის წარმოებასა და გაყიდვაში. კომპანიას აქვს 39 ქარხანა 23 ქვეყანაში. Საბაზრო ღირებულებაკომპანია დაახლოებით 1,87 მილიარდი დოლარია.მისი აქციები ჩამოთვლილია ნიუ-იორკის საფონდო ბირჟაზე აბრევიატურით CBT. კომპანიის შემოსავლები მითითებული პერიოდისთვის მიღებულია ნახ. 3.

ბრინჯი. 3. Cabot Corporation-ის შემოსავალი 1982-2001 წლებში (მილიარდი დოლარი)

როგორც ხედავთ, შემოსავლის გრძელვადიანი ზრდის ტენდენცია დაფარულია რყევების დიდი რაოდენობით. ამრიგად, გრაფიკის ვიზუალური ანალიზი არ გვაძლევს იმის მტკიცებას, რომ მონაცემებს აქვს ტენდენცია. ასეთ სიტუაციებში შეგიძლიათ გამოიყენოთ საშუალო მოძრავი ან ექსპონენციალური დაგლუვების მეთოდები.

მოძრავი საშუალოები.მოძრავი საშუალო მეთოდი ძალიან სუბიექტურია და დამოკიდებულია პერიოდის ხანგრძლივობაზე. შერჩეული საშუალოების გამოსათვლელად. ციკლური რყევების აღმოსაფხვრელად, პერიოდის სიგრძე უნდა იყოს ციკლის საშუალო სიგრძის მთელი რიცხვი. მოძრავი საშუალოები არჩეული პერიოდისთვის, რომელსაც აქვს სიგრძე , შექმენით საშუალო მნიშვნელობების თანმიმდევრობა, რომელიც გამოითვლება სიგრძის თანმიმდევრობებისთვის . მოძრავი საშუალოები სიმბოლურია MA(L).

დავუშვათ, გვინდა გამოვთვალოთ ხუთი წლის მოძრავი საშუალო მაჩვენებლები გაზომილი მონაცემებიდან = 11 წელი. Იმდენად, რამდენადაც = 5, ხუთწლიანი მოძრავი საშუალოები ქმნიან საშუალოების თანმიმდევრობას, რომელიც გამოითვლება დროის სერიების ზედიზედ ხუთ მნიშვნელობაზე. ხუთწლიანი მოძრავი საშუალოებიდან პირველი გამოითვლება პირველი ხუთი წლის მონაცემების შეჯამებით, შემდეგ ხუთზე გაყოფით:

მეორე ხუთწლიანი მოძრავი საშუალო გამოითვლება 2-დან 6-მდე წლების მონაცემების შეჯამებით, შემდეგ ხუთზე გაყოფით:

ეს პროცესი გრძელდება მანამ, სანამ არ გამოითვლება ბოლო ხუთი წლის საშუალო მოძრავი მაჩვენებელი. წლიურ მონაცემებთან მუშაობისას უნდა ვივარაუდოთ რაოდენობა (მოძრავი საშუალოების გამოსათვლელად არჩეული პერიოდის ხანგრძლივობა) კენტი. ამ შემთხვევაში, პირველის მოძრავი საშუალოების გამოთვლა შეუძლებელია ( – 1)/2 და ბოლო ( – 1)/2 წელი. ამიტომ ხუთწლიანი მოძრავი საშუალოზე მუშაობისას შეუძლებელია გამოთვლების ჩატარება პირველი ორი და ბოლო ორი წლის განმავლობაში. წელი, რომლისთვისაც მოძრავი საშუალო გამოითვლება, უნდა იყოს სიგრძის პერიოდის შუაში . თუ = 11, ა = 5, პირველი მოძრავი საშუალო უნდა შეესაბამებოდეს მესამე წელს, მეორე - მეოთხეს და ბოლო - მეცხრეს. ნახ. 4 გვიჩვენებს 3 და 7 წლიან მოძრავი საშუალო დიაგრამებს, რომლებიც გამოითვლება Cabot Corporation-ის მოგებაზე 1982 წლიდან 2001 წლამდე.

ბრინჯი. 4. 3 და 7 წლიანი მოძრავი საშუალოების გრაფიკები გამოთვლილი Cabot Corporation-ის შემოსავლებისთვის

გაითვალისწინეთ, რომ სამწლიანი მოძრავი საშუალოების გაანგარიშებისას, პირველი და ბოლო წლების შესაბამისი დაკვირვებული მნიშვნელობები იგნორირებულია. ანალოგიურად, შვიდი წლის მოძრავი საშუალოების გაანგარიშებისას, პირველი და ბოლო სამი წლის შედეგები არ არის. გარდა ამისა, შვიდი წლის მოძრავი საშუალო მაჩვენებლები არბილებს დროის სერიებს ბევრად უფრო მეტად, ვიდრე სამწლიანი მოძრავი საშუალო. ეს იმიტომ ხდება, რომ შვიდი წლის მოძრავი საშუალო მაჩვენებლები უფრო ხანგრძლივ პერიოდს შეესაბამება. სამწუხაროდ, რაც უფრო გრძელია პერიოდი, მით უფრო ნაკლები მოძრავი საშუალო შეიძლება გამოითვალოს და წარმოდგენილი იყოს სქემაზე. აქედან გამომდინარე, არასასურველია შვიდ წელზე მეტის არჩევა მოძრავი საშუალოების გამოსათვლელად, რადგან ძალიან ბევრი ქულა ამოვარდება დიაგრამის დასაწყისიდან და ბოლოდან, რაც ამახინჯებს დროის სერიების ფორმას.

ექსპონენციალური დაგლუვება.გრძელვადიანი ტენდენციების იდენტიფიცირებისთვის, რომლებიც ახასიათებს მონაცემთა ცვლილებებს, მოძრავი საშუალოების გარდა, გამოიყენება ექსპონენციალური დაგლუვების მეთოდი. ეს მეთოდი ასევე შესაძლებელს ხდის მოკლევადიანი პროგნოზების გაკეთებას (ერთი პერიოდის განმავლობაში), როდესაც გრძელვადიანი ტენდენციების არსებობა სადავოა. ამის გამო ექსპონენციალური დაგლუვების მეთოდს აქვს მნიშვნელოვანი უპირატესობა მოძრავი საშუალო მეთოდთან შედარებით.

ექსპონენციალური დაგლუვების მეთოდმა მიიღო თავისი სახელი ექსპონენტურად შეწონილი მოძრავი საშუალოების თანმიმდევრობიდან. ამ თანმიმდევრობის თითოეული მნიშვნელობა დამოკიდებულია ყველა წინა დაკვირვებად მნიშვნელობაზე. ექსპონენციური დაგლუვების მეთოდის კიდევ ერთი უპირატესობა მოძრავი საშუალო მეთოდის მიმართ არის ის, რომ ამ უკანასკნელის გამოყენებისას ზოგიერთი მნიშვნელობები უგულებელყოფილია. ექსპონენციური გამარტივებით, დაკვირვებულ მნიშვნელობებზე მინიჭებული წონები დროთა განმავლობაში მცირდება, ასე რომ, გამოთვლების შესრულების შემდეგ, ყველაზე ხშირად წარმოქმნილი მნიშვნელობები მიიღებენ ყველაზე მეტ წონას, ხოლო იშვიათი მნიშვნელობები მიიღებენ ყველაზე ნაკლებ წონას. მიუხედავად დიდი რაოდენობის გამოთვლებისა, Excel საშუალებას გაძლევთ განახორციელოთ ექსპონენციალური დაგლუვების მეთოდი.

განტოლება, რომელიც საშუალებას გაძლევთ გაამარტივოთ დროის სერიები დროის თვითნებურ პერიოდში მე, შეიცავს სამ წევრს: მიმდინარე დაკვირვებულ მნიშვნელობას მე, რომელიც მიეკუთვნება დროის სერიას, წინა ექსპონენციურად გათლილ მნიშვნელობას მე –1 და მიენიჭა წონა .

(3) E 1 = Y 1 E i = WY i + (1 – W) E i–1 , i = 2, 3, 4, …

სადაც მეარის გამოთვლილი ექსპონენციურად გათლილი სერიის მნიშვნელობა მე- პერიოდი, ეი –1 არის ექსპონენციურად გათლილი სერიის მნიშვნელობა, რომელიც გამოითვლება ( მე– 1)-ე პერიოდი, Y iარის დროის სერიების დაკვირვებული მნიშვნელობა in მე- პერიოდი, არის სუბიექტური წონა, ან დამარბილებელი ფაქტორი (0< < 1).

სერიის წევრებისთვის მინიჭებული დამარბილებელი ფაქტორის, ანუ წონის არჩევანი ფუნდამენტურად მნიშვნელოვანია, რადგან ის პირდაპირ გავლენას ახდენს შედეგზე. სამწუხაროდ, ეს არჩევანი გარკვეულწილად სუბიექტურია. თუ მკვლევარს სურს უბრალოდ გამორიცხოს არასასურველი ციკლური ან შემთხვევითი რყევები დროის სერიებიდან, უნდა აირჩიოს მცირე მნიშვნელობები. (ნულთან ახლოს). მეორეს მხრივ, თუ დროის სერია გამოიყენება პროგნოზირებისთვის, აუცილებელია დიდი წონის არჩევა (ერთობასთან ახლოს). პირველ შემთხვევაში აშკარად ვლინდება გრძელვადიანი ტენდენციები დროის სერიებში. მეორე შემთხვევაში იზრდება მოკლევადიანი პროგნოზირების სიზუსტე (ნახ. 5).

ბრინჯი. 5 ექსპონენტურად გათლილი დროის სერია (W=0.50 და W=0.25) Cabot Corporation-ის მოგების მონაცემებისთვის 1982 წლიდან 2001 წლამდე; იხილეთ გაანგარიშების ფორმულები Excel ფაილში

ექსპონენტურად გათლილი მნიშვნელობა მიღებული მედროის ინტერვალი, შეიძლება გამოყენებულ იქნას, როგორც სავარაუდო მნიშვნელობის შეფასება ( მე+1)-th interval:

Cabot Corporation-ის შემოსავლის პროგნოზირება 2002 წელს ექსპონენტურად გათლილი დროის სერიების საფუძველზე, რომელიც შეესაბამება წონას = 0.25, შეიძლება გამოყენებულ იქნას 2001 წელს გამოთვლილი გათლილი მნიშვნელობა. ნახ. სურათი 5 გვიჩვენებს, რომ ეს მაჩვენებელი არის 1,651.0 მილიონი აშშ დოლარი. როდესაც კომპანიის 2002 წლის მოგების მონაცემები ხელმისაწვდომი გახდება, განტოლება (3) შეიძლება გამოყენებულ იქნას და 2003 წლის მოგების დონის პროგნოზირება შესაძლებელია 2002 წლის შემცირებული მოგების გამოყენებით:

საანალიზო პაკეტი Excel-ს შეუძლია ექსპონენციალური გამარტივება ერთი დაწკაპუნებით. გაიარეთ მენიუ მონაცემებიᲛონაცემთა ანალიზიდა აირჩიეთ ვარიანტი ექსპონენციალური გლუვი(ნახ. 6). გაღებულ ფანჯარაში ექსპონენციალური გლუვიპარამეტრების დაყენება. სამწუხაროდ, პროცედურა საშუალებას გაძლევთ შექმნათ მხოლოდ ერთი გათლილი სერია, ასე რომ, თუ გსურთ "თამაში" პარამეტრით , გაიმეორეთ პროცედურა.

ბრინჯი. 6. ექსპონენციალური დაგლუვების შედგენა ანალიზის პაკეტის გამოყენებით

უმცირესი კვადრატების ტენდენცია და პროგნოზირება

დროის სერიების კომპონენტებს შორის ტენდენცია ყველაზე ხშირად შეისწავლება. ეს არის ტენდენცია, რომელიც საშუალებას გაძლევთ გააკეთოთ მოკლევადიანი და გრძელვადიანი პროგნოზები. დროის სერიებში გრძელვადიანი ტენდენციის დასადგენად, ჩვეულებრივ დგება გრაფიკი, რომელზეც დაკვირვებული მონაცემები (დამოკიდებული ცვლადის მნიშვნელობები) იწერება ვერტიკალურ ღერძზე და დროის ინტერვალები (დამოუკიდებელი ცვლადის მნიშვნელობები). გამოსახულია ჰორიზონტალურ ღერძზე. ამ ნაწილში ჩვენ აღვწერთ წრფივი, კვადრატული და ექსპონენციალური ტენდენციის იდენტიფიცირების პროცედურას უმცირესი კვადრატების მეთოდის გამოყენებით.

ხაზოვანი ტენდენციის მოდელიარის უმარტივესი მოდელი, რომელიც გამოიყენება პროგნოზირებისთვის: Y i = β 0 + β 1 X ი + ე i . წრფივი ტენდენციის განტოლება:

მოცემული მნიშვნელოვნების α დონისთვის, ნულოვანი ჰიპოთეზა უარყოფილია ტესტის შემთხვევაში - სტატისტიკა აღემატება ზედა ან ქვედა კრიტიკულ დონეს ნაკლები - დისტრიბუციები. ანუ გადაწყვეტილების წესი ჩამოყალიბებულია შემდეგნაირად: თუ > Uან < ტ ლ, ნულოვანი ჰიპოთეზა H 0უარყოფილია, წინააღმდეგ შემთხვევაში ნულოვანი ჰიპოთეზა არ არის უარყოფილი (სურ. 14).

ბრინჯი. 14. ჰიპოთეზის უარყოფის სფეროები ორკუდიანი ავტორეგრესიის პარამეტრის მნიშვნელოვნების ტესტისთვის , რომელსაც აქვს უმაღლესი ორდენი

თუ ნულოვანი ჰიპოთეზაა ( = 0) არ არის უარყოფილი, რაც ნიშნავს, რომ შერჩეული მოდელი შეიცავს ძალიან ბევრ პარამეტრს. კრიტერიუმი საშუალებას გვაძლევს გავაუქმოთ მოდელის წამყვანი ტერმინი და შევაფასოთ ავტორეგრესიული რიგის მოდელი р–1. ეს პროცედურა უნდა გაგრძელდეს ნულოვან ჰიპოთეზამდე H 0არ იქნება უარს.

  1. აირჩიეთ შეკვეთა შეფასებული ავტორეგრესიული მოდელი, იმის გათვალისწინებით, რომ -მნიშვნელოვნების კრიტერიუმი აქვს -2p-1თავისუფლების ხარისხები.
  2. ჩამოაყალიბეთ ცვლადების თანმიმდევრობა „დაგვიანებით“ ისე, რომ პირველი ცვლადი დაგვიანებულია ერთი დროის ინტერვალით, მეორე - ორით და ა.შ. ბოლო მნიშვნელობა უნდა გადაიდოს დროის ინტერვალები (იხ. სურ. 15).
  3. მიმართეთ საანალიზო პაკეტი Excel-ის გამოსათვლელად რეგრესიის მოდელი, რომელიც შეიცავს ყველაფერს დროის სერიების მნიშვნელობები დაგვიანებით.
  4. შეაფასეთ პარამეტრის მნიშვნელობა , რომელსაც აქვს უმაღლესი რიგი: ა) თუ ნულოვანი ჰიპოთეზა უარყოფილია, ავტორეგრესიული მოდელი შეიძლება მოიცავდეს ყველა პარამეტრები; ბ) თუ ნულოვანი ჰიპოთეზა არ იქნა უარყოფილი, გააუქმეთ -ე ცვლადი და გაიმეორეთ ნაბიჯები 3 და 4 ახალი მოდელისთვის, რომელიც მოიცავს р–1პარამეტრი. ახალი მოდელის მნიშვნელოვნების ტესტი ეფუძნება -კრიტერიუმები, თავისუფლების ხარისხების რაოდენობა განისაზღვრება პარამეტრების ახალი რაოდენობით.
  5. გაიმეორეთ ნაბიჯები 3 და 4, სანამ ავტორეგრესიული მოდელის უმაღლესი ტერმინი არ გახდება სტატისტიკურად მნიშვნელოვანი.

ავტორეგრესიული მოდელირების საჩვენებლად, დავუბრუნდეთ კომპანიის Wm რეალური შემოსავლის დროის სერიების ანალიზს. Wrigley Jr. ნახ. 15 გვიჩვენებს მონაცემებს, რომლებიც საჭიროა პირველი, მეორე და მესამე რიგის ავტორეგრესიული მოდელების შესაქმნელად. მესამე რიგის მოდელის ასაგებად საჭიროა ამ ცხრილის ყველა სვეტი. მეორე რიგის ავტორეგრესიული მოდელის აგებისას ბოლო სვეტი იგნორირებულია. პირველი რიგის ავტორეგრესიული მოდელის აგებისას, ბოლო ორი სვეტი იგნორირებულია. ამრიგად, პირველი, მეორე და მესამე რიგის ავტორეგრესიული მოდელების აგებისას 20 ცვლადიდან ერთი, ორი და სამი ცვლადი გამოირიცხება შესაბამისად.

ყველაზე ზუსტი ავტორეგრესიული მოდელის არჩევანი იწყება მესამე რიგის მოდელით. სწორი მუშაობისთვის საანალიზო პაკეტიშემდეგნაირად ხდება შეყვანის ინტერვალი მიუთითეთ დიაპაზონი B5:B21 და შეყვანის ინტერვალი X– C5:E21. ანალიზის მონაცემები ნაჩვენებია ნახ. 16.

შეამოწმეთ პარამეტრის მნიშვნელობა A 3, რომელსაც აქვს უმაღლესი ორდენი. მისი ქულა a 3არის -0,006 (უჯრედი C20 სურათზე 16) და სტანდარტული შეცდომა არის 0,326 (უჯრედი D20). ჰიპოთეზების შესამოწმებლად H 0: A 3 = 0 და H 1: A 3 ≠ 0, ჩვენ ვიანგარიშებთ - სტატისტიკა:

კრიტერიუმები n–2p–1 = 20–2*3–1 = თავისუფლების 13 გრადუსით არის: ტ ლ= STUDENT.INR(0.025, 13) = -2.160; t U\u003d STUDENT.INR (0.975, 13) \u003d +2.160. რადგან -2.160< = –0,019 < +2,160 и = 0,985 > α = 0,05, ნულოვანი ჰიპოთეზა H 0არ შეიძლება უარი თქვას. ამრიგად, მესამე რიგის პარამეტრს არ აქვს სტატისტიკური მნიშვნელობა ავტორეგრესიულ მოდელში და უნდა მოიხსნას.

გავიმეოროთ ანალიზი მეორე რიგის ავტორეგრესიული მოდელისთვის (ნახ. 17). ყველაზე მაღალი რიგის მქონე პარამეტრის შეფასება, a 2= -0.205 და მისი სტანდარტული შეცდომა არის 0.276. ჰიპოთეზების შესამოწმებლად H 0: A 2 = 0 და H 1: A 2 ≠ 0, ჩვენ ვიანგარიშებთ - სტატისტიკა:

მნიშვნელოვნების დონეზე α = 0.05, ორმხრივი კრიტიკული მნიშვნელობები კრიტერიუმები n–2p–1 = 20–2*2–1 = თავისუფლების 15 გრადუსით არის: ტ ლ\u003d STUDENT.OBR (0.025; 15) \u003d -2.131; t U\u003d STUDENT.OBR (0.975, 15) \u003d +2.131. რადგან -2.131< = –0,744 < –2,131 и = 0,469 > α = 0,05, ნულოვანი ჰიპოთეზა H 0არ შეიძლება უარი თქვას. ამრიგად, მეორე რიგის პარამეტრი არ არის სტატისტიკურად მნიშვნელოვანი და უნდა ამოღებულ იქნეს მოდელიდან.

გავიმეოროთ ანალიზი პირველი რიგის ავტორეგრესიული მოდელისთვის (ნახ. 18). ყველაზე მაღალი რიგის მქონე პარამეტრის შეფასება, a 1= 1.024 და მისი სტანდარტული შეცდომა არის 0.039. ჰიპოთეზების შესამოწმებლად H 0: A 1 = 0 და H 1: A 1 ≠ 0, ჩვენ ვიანგარიშებთ - სტატისტიკა:

მნიშვნელოვნების დონეზე α = 0.05, ორმხრივი კრიტიკული მნიშვნელობები კრიტერიუმები n–2p–1 = 20–2*1–1 = თავისუფლების 17 გრადუსით არის: ტ ლ\u003d STUDENT.OBR (0.025; 17) \u003d -2.110; t U\u003d STUDENT.OBR (0.975, 17) \u003d +2.110. რადგან -2.110< = 26,393 < –2,110 и = 0,000 < α = 0,05, нулевую гипотезу H 0უარი უნდა თქვან. ამრიგად, პირველი რიგის პარამეტრი არის სტატისტიკურად მნიშვნელოვანი და არ უნდა იყოს ამოღებული მოდელიდან. ასე რომ, პირველი რიგის ავტორეგრესიული მოდელი აახლოებს თავდაპირველ მონაცემებს სხვებზე უკეთ. შეფასებების გამოყენება a 0 = 18,261, a 1= 1,024 და გასული წლის დროის სერიების მნიშვნელობა - Y 20 = 1 371,88, შეგვიძლია ვიწინასწარმეტყველოთ კომპანიის რეალური შემოსავლის მნიშვნელობა Wm. Wrigley Jr. კომპანია 2002 წელს:

ადეკვატური პროგნოზირების მოდელის არჩევა

ზემოთ აღწერილია დროის სერიების მნიშვნელობების პროგნოზირების ექვსი მეთოდი: წრფივი, კვადრატული და ექსპონენციალური ტენდენციის მოდელები და პირველი, მეორე და მესამე რიგის ავტორეგრესიული მოდელები. არის თუ არა ოპტიმალური მოდელი? ექვსი აღწერილი მოდელიდან რომელი უნდა იყოს გამოყენებული დროის სერიების მნიშვნელობის პროგნოზირებისთვის? ქვემოთ ჩამოთვლილია ოთხი პრინციპი, რომელიც უნდა წარმართავდეს ადეკვატური პროგნოზირების მოდელის შერჩევას. ეს პრინციპები ეფუძნება მოდელის სიზუსტის შეფასებებს. ვარაუდობენ, რომ დროის სერიების მნიშვნელობების პროგნოზირება შესაძლებელია მისი წინა მნიშვნელობების შესწავლით.

პროგნოზირების მოდელების არჩევის პრინციპები:

  • ნარჩენი ანალიზის ჩატარება.
  • შეაფასეთ ნარჩენი შეცდომის სიდიდე კვადრატული განსხვავებების გამოყენებით.
  • შეაფასეთ ნარჩენი შეცდომის სიდიდე აბსოლუტური განსხვავებების გამოყენებით.
  • იხელმძღვანელეთ ეკონომიურობის პრინციპით.

ნარჩენების ანალიზი.შეგახსენებთ, რომ ნარჩენი არის განსხვავება პროგნოზირებულ და დაკვირვებულ მნიშვნელობებს შორის. დროის სერიების მოდელის შექმნის შემდეგ, თქვენ უნდა გამოთვალოთ ნარჩენები თითოეული მათგანისთვის ინტერვალებით. როგორც ნაჩვენებია ნახ. 19, პანელი A, თუ მოდელი ადეკვატურია, ნარჩენები არის დროის სერიების შემთხვევითი კომპონენტი და, შესაბამისად, არარეგულარულად არის განაწილებული. მეორეს მხრივ, როგორც ნაჩვენებია დანარჩენ პანელებში, თუ მოდელი არ არის ადეკვატური, ნარჩენებს შეიძლება ჰქონდეთ სისტემატური დამოკიდებულება, რომელიც არ ითვალისწინებს არც ტენდენციას (პანელი B), არც ციკლურს (პანელი C). ან სეზონური კომპონენტი (პანელი D).

ბრინჯი. 19. ნარჩენების ანალიზი

აბსოლუტური და ფუძე-საშუალო კვადრატული ნარჩენი შეცდომების გაზომვა.თუ ნარჩენების ანალიზი არ იძლევა ერთადერთი ადეკვატური მოდელის დადგენის საშუალებას, შეგიძლიათ გამოიყენოთ სხვა მეთოდები ნარჩენი შეცდომის სიდიდის შეფასების საფუძველზე. სამწუხაროდ, სტატისტიკოსებმა ვერ მიაღწიეს კონსენსუსს პროგნოზირებისთვის გამოყენებული მოდელების ნარჩენი შეცდომების საუკეთესო შეფასებაზე. უმცირესი კვადრატების პრინციპზე დაყრდნობით, შეგიძლიათ ჯერ შეასრულოთ რეგრესიული ანალიზი და გამოთვალოთ შეფასების სტანდარტული შეცდომა. SXY. კონკრეტული მოდელის გაანალიზებისას, ეს მნიშვნელობა არის კვადრატული განსხვავებების ჯამი დროის სერიების რეალურ და პროგნოზირებულ მნიშვნელობებს შორის. თუ მოდელი სრულყოფილად უახლოვდება დროის სერიების მნიშვნელობებს წინა დროის წერტილებში, შეფასების სტანდარტული შეცდომა არის ნული. მეორეს მხრივ, თუ მოდელი კარგად არ უახლოვდება დროის სერიების მნიშვნელობებს წინა დროის წერტილებში, შეფასების სტანდარტული შეცდომა დიდია. ამრიგად, რამდენიმე მოდელის ადეკვატურობის გაანალიზებით, შეიძლება აირჩიოთ მოდელი, რომელსაც აქვს შეფასების მინიმალური სტანდარტული შეცდომა S XY.

ამ მიდგომის მთავარი მინუსი არის შეცდომების გადაჭარბება ინდივიდუალური მნიშვნელობების პროგნოზირებისას. სხვა სიტყვებით რომ ვთქვათ, რაიმე დიდი განსხვავება მნიშვნელობებს შორის მედა Ŷ მეკვადრატული შეცდომების ჯამის გამოთვლისას სსე კვადრატულია, ე.ი. იზრდება. ამ მიზეზით, ბევრი სტატისტიკოსი ურჩევნია გამოიყენოს საშუალო აბსოლუტური გადახრა (MAD) პროგნოზირების მოდელის ადეკვატურობის შესაფასებლად:

კონკრეტული მოდელების გაანალიზებისას, MAD მნიშვნელობა არის დროის სერიების რეალურ და პროგნოზირებულ მნიშვნელობებს შორის განსხვავებების მოდულების საშუალო მნიშვნელობა. თუ მოდელი შესანიშნავად უახლოვდება დროის სერიების მნიშვნელობებს წინა დროის წერტილებში, საშუალო აბსოლუტური გადახრა არის ნული. მეორეს მხრივ, თუ მოდელი კარგად არ ერგება დროის სერიების ასეთ მნიშვნელობებს, საშუალო აბსოლუტური გადახრა დიდია. ამრიგად, რამდენიმე მოდელის ადეკვატურობის გაანალიზებით, შეიძლება აირჩიოთ მოდელი, რომელსაც აქვს მინიმალური საშუალო აბსოლუტური გადახრა.

ეკონომიის პრინციპი.თუ შეფასებების სტანდარტული შეცდომებისა და საშუალო აბსოლუტური გადახრების ანალიზი არ გვაძლევს ოპტიმალური მოდელის დადგენის საშუალებას, შეიძლება გამოვიყენოთ მეოთხე მეთოდი, რომელიც დაფუძნებულია პარსიმონიის პრინციპზე. ეს პრინციპი ამბობს, რომ რამდენიმე თანაბარ მოდელს შორის უნდა აირჩეს უმარტივესი.

თავში განხილულ ექვს პროგნოზირების მოდელს შორის ყველაზე მარტივია წრფივი და კვადრატული რეგრესიის მოდელები, ასევე პირველი რიგის ავტორეგრესიული მოდელი. დანარჩენი მოდელები ბევრად უფრო რთულია.

პროგნოზირების ოთხი მეთოდის შედარება.ოპტიმალური მოდელის არჩევის პროცესის საილუსტრაციოდ, დავუბრუნდეთ დროის სერიას, რომელიც შედგება კომპანიის რეალური შემოსავლის Wm მნიშვნელობებისგან. Wrigley Jr. კომპანია. შევადაროთ ოთხი მოდელი: წრფივი, კვადრატული, ექსპონენციალური და პირველი რიგის ავტორეგრესიული მოდელი. (მეორე და მესამე რიგის ავტორეგრესიული მოდელები მხოლოდ ოდნავ აუმჯობესებენ მოცემული დროის სერიების მნიშვნელობების პროგნოზირების სიზუსტეს, ამიტომ მათი იგნორირება შესაძლებელია.) 20 გვიჩვენებს ნარჩენების ნაკვეთებს, რომლებიც აგებულია პროგნოზირების ოთხი მეთოდის ანალიზში საანალიზო პაკეტი Excel. ამ გრაფიკებზე დაყრდნობით დასკვნების გამოტანისას ფრთხილად უნდა იყოთ, რადგან დროის სერია შეიცავს მხოლოდ 20 ქულას. მშენებლობის მეთოდებისთვის იხილეთ Excel ფაილის შესაბამისი ფურცელი.

ბრინჯი. 20. ნარჩენების ნაკვეთები აგებულია ოთხი პროგნოზირების მეთოდის ანალიზში საანალიზო პაკეტი excel

არცერთი მოდელი, გარდა პირველი რიგის ავტორეგრესიული მოდელისა, არ ითვალისწინებს ციკლურ კომპონენტს. სწორედ ეს მოდელი აახლოებს დაკვირვებებს სხვებზე უკეთ და ხასიათდება ყველაზე ნაკლებად სისტემატური სტრუქტურით. ამრიგად, ოთხივე მეთოდის ნარჩენების ანალიზმა აჩვენა, რომ საუკეთესოა პირველი რიგის ავტორეგრესიული მოდელი, ხოლო წრფივ, კვადრატულ და ექსპონენციალურ მოდელებს აქვთ ნაკლები სიზუსტე. ამის შესამოწმებლად შევადაროთ ამ მეთოდების ნარჩენი შეცდომები (ნახ. 21). გაანგარიშების მეთოდი შეგიძლიათ იხილოთ Excel ფაილის გახსნით. ნახ. 21 არის რეალური მნიშვნელობები Y i(სვეტი რეალური შემოსავალი), პროგნოზირებული მნიშვნელობები Ŷ მე, ისევე როგორც დანარჩენი მეოთხივე მოდელისთვის. გარდა ამისა, ნაჩვენებია მნიშვნელობები YXდა ᲨᲔᲨᲚᲘᲚᲘ.. რაოდენობის ოთხივე მოდელისთვის s YXდა ᲨᲔᲨᲚᲘᲚᲘ.დაახლოებით იგივე. ექსპონენციალური მოდელი შედარებით დაბალია, ხოლო წრფივი და კვადრატული მოდელები უფრო მაღალია სიზუსტით. როგორც მოსალოდნელი იყო, ყველაზე მცირე მნიშვნელობები YXდა ᲨᲔᲨᲚᲘᲚᲘ.აქვს პირველი რიგის ავტორეგრესიული მოდელი.

ბრინჯი. 21. პროგნოზირების ოთხი მეთოდის შედარება S YX და MAD ინდიკატორების გამოყენებით

კონკრეტული პროგნოზირების მოდელის არჩევისას აუცილებელია დროის სერიების შემდგომი ცვლილებების ფრთხილად მონიტორინგი. სხვა საკითხებთან ერთად, ასეთი მოდელი იქმნება მომავალში დროის სერიების მნიშვნელობების სწორად პროგნოზირებისთვის. სამწუხაროდ, ასეთი პროგნოზირების მოდელები არ ითვალისწინებენ ცვლილებებს დროის სერიების სტრუქტურაში. აბსოლუტურად აუცილებელია არა მხოლოდ ნარჩენი შეცდომის შედარება, არამედ სხვა მოდელების გამოყენებით მიღებული დროის სერიების მომავალი მნიშვნელობების პროგნოზირების სიზუსტე. ახალი მნიშვნელობის გაზომვით მედაკვირვებულ დროის ინტერვალში ის დაუყოვნებლივ უნდა შევადაროთ პროგნოზირებულ მნიშვნელობას. თუ განსხვავება ძალიან დიდია, პროგნოზის მოდელი უნდა გადაიხედოს.

დროის პროგნოზირება x სერია სეზონურ მონაცემებზე დაყრდნობით

აქამდე ჩვენ შევისწავლეთ წლიური მონაცემებისგან შემდგარი დროის სერიები. თუმცა, მრავალი დროის სერია შედგება კვარტალურად, ყოველთვიურად, ყოველკვირეულად, ყოველდღიურად და საათობრივად გაზომილი რაოდენობებისგან. როგორც ნაჩვენებია ნახ. 2, თუ მონაცემები იზომება ყოველთვიურად ან კვარტალურად, მხედველობაში უნდა იქნას მიღებული სეზონური კომპონენტი. ამ განყოფილებაში განვიხილავთ მეთოდებს ასეთი დროის სერიების მნიშვნელობების პროგნოზირებისთვის.

თავის დასაწყისში აღწერილ სცენარში ნახსენები იყო Wal-Mart Stores, Inc. კომპანიის საბაზრო კაპიტალიზაცია 229 მილიარდი დოლარია, მისი აქციები ნიუ-იორკის საფონდო ბირჟაზეა ჩამოთვლილი აბრევიატურით WMT. კომპანიის ფინანსური წელი მთავრდება 31 იანვარს, ამიტომ 2002 წლის მეოთხე კვარტალი მოიცავს 2001 წლის ნოემბერსა და დეკემბერს და 2002 წლის იანვარს. კომპანიის კვარტალური მოგების დროის სერია ნაჩვენებია ნახ. 22.

ბრინჯი. 22. Wal-Mart Stores, Inc. კვარტალური მოგება. (მილიონი დოლარი)

ასეთი კვარტალური სერიებისთვის, როგორიც ეს არის, კლასიკური მულტიპლიკაციური მოდელი, ტრენდული, ციკლური და შემთხვევითი კომპონენტის გარდა, შეიცავს სეზონურ კომპონენტს: Y i = თ ი* სი* C i* მე მე

ყოველთვიური და დროებითი პროგნოზი x რიგები უმცირესი კვადრატების მეთოდის გამოყენებით.რეგრესიის მოდელი, რომელიც მოიცავს სეზონურ კომპონენტს, ეფუძნება კომბინირებულ მიდგომას. ტენდენციის გამოსათვლელად გამოიყენება ადრე აღწერილი უმცირესი კვადრატების მეთოდი, ხოლო სეზონური კომპონენტის აღრიცხვისთვის გამოიყენება კატეგორიული ცვლადი (დამატებითი ინფორმაციისთვის იხილეთ სექცია მოჩვენებითი ცვლადი რეგრესიის მოდელები და ურთიერთქმედების ეფექტები). ექსპონენციალური მოდელი გამოიყენება დროის სერიების მიახლოებისთვის სეზონური კომპონენტების გათვალისწინებით. კვარტალური დროის სერიების მიახლოების მოდელში დაგვჭირდა სამი ცვლადი ოთხი კვარტლის აღრიცხვისთვის. Q1, Q2და Q 3და ყოველთვიური დროის სერიების მოდელში 12 თვე წარმოდგენილია 11 მოჩვენებითი ცვლადის გამოყენებით. ვინაიდან ეს მოდელები პასუხად იყენებენ ჟურნალის ცვლადს Y i, მაგრამ არა Y i, რეალური რეგრესიის კოეფიციენტების გამოსათვლელად აუცილებელია შებრუნებული ტრანსფორმაციის შესრულება.

მოდელის აგების პროცესის საილუსტრაციოდ, რომელიც მიახლოებით კვარტალურ დროის სერიას შეესაბამება, დავუბრუნდეთ Wal-Mart-ის მოგებას. ექსპონენციალური მოდელის პარამეტრების გამოყენებით მიღებული საანალიზო პაკეტი Excel ნაჩვენებია ნახ. 23.

ბრინჯი. 23. კვარტალური შემოსავლების რეგრესული ანალიზი Wal-Mart Stores, Inc.

ჩანს, რომ ექსპონენციალური მოდელი საკმაოდ კარგად უახლოვდება თავდაპირველ მონაცემებს. შერეული კორელაციის კოეფიციენტი 2 უდრის 99,4% (უჯრედები J5), შერეული კორელაციის კორექტირებული კოეფიციენტი - 99,3% (უჯრედები J6), ტესტი -სტატისტიკა - 1333.51 (უჯრედები M12), და - ღირებულება 0.0000. მნიშვნელოვნების დონეზე α = 0,05, ყოველი რეგრესიის კოეფიციენტი კლასიკურ მულტიპლიკაციურ დროის სერიების მოდელში არის სტატისტიკურად მნიშვნელოვანი. მათზე გაძლიერების ოპერაციის გამოყენებისას ვიღებთ შემდეგ პარამეტრებს:

შანსები ინტერპრეტირებულია შემდეგნაირად.

რეგრესიის კოეფიციენტების გამოყენება ბ ი, შეგიძლიათ წინასწარ განსაზღვროთ კომპანიის მიერ გამომუშავებული შემოსავალი კონკრეტულ კვარტალში. მაგალითად, მოდით ვიწინასწარმეტყველოთ კომპანიის შემოსავალი 2002 წლის მეოთხე კვარტალში ( Xმე = 35):

ჟურნალი = 0 + 1 Xმე = 4,265 + 0,016*35 = 4,825

= 10 4,825 = 66 834

ამრიგად, 2002 წლის მეოთხე კვარტალში პროგნოზის მიხედვით, კომპანიას უნდა მიეღო 67 მილიარდი დოლარის ტოლი შემოსავალი (მილიონიანი სიზუსტით პროგნოზის გაკეთება ძნელად დაგჭირდებათ). პროგნოზის გახანგრძლივება დროის სერიების მიღმა პერიოდზე, როგორიცაა 2003 წლის პირველი კვარტალი ( Xმე = 36, Q1= 1), აუცილებელია შემდეგი გამოთვლების შესრულება:

ჟურნალი Ŷi = ბ 0 + ბ 1Xმე + b 2 Q 1 = 4,265 + 0,016*36 – 0,093*1 = 4,748

10 4,748 = 55 976

ინდექსები

ინდექსები გამოიყენება როგორც ინდიკატორები, რომლებიც რეაგირებენ ეკონომიკური მდგომარეობის ან ბიზნეს აქტივობის ცვლილებებზე. არსებობს ინდექსების მრავალი სახეობა, კერძოდ, ფასების ინდექსები, რაოდენობრივი ინდექსები, ღირებულების ინდექსები და სოციოლოგიური ინდექსები. ამ განყოფილებაში განვიხილავთ მხოლოდ ფასების ინდექსს. ინდექსი- ზოგიერთის ღირებულება ეკონომიკური მაჩვენებელი(ან ინდიკატორთა ჯგუფი) დროის კონკრეტულ მომენტში, გამოხატული მისი მნიშვნელობის პროცენტულად დროის საბაზისო მომენტში.

ფასების ინდექსი.ფასების მარტივი ინდექსი ასახავს საქონლის (ან საქონლის ჯგუფის) ფასის პროცენტულ ცვლილებას დროის მოცემულ პერიოდში ამ საქონლის (ან საქონლის ჯგუფის) ფასთან შედარებით წარსულში დროის კონკრეტულ მომენტში. ფასების ინდექსის გაანგარიშებისას, უპირველეს ყოვლისა, უნდა აირჩიოთ საბაზისო დროის ინტერვალი - დროის ინტერვალი წარსულში, რომელთანაც შედარებები იქნება. კონკრეტული ინდექსის საბაზისო პერიოდის არჩევისას უპირატესობა ენიჭება ეკონომიკური სტაბილურობის პერიოდებს ეკონომიკური გაფართოების ან რეცესიის პერიოდებთან შედარებით. გარდა ამისა, საბაზისო პერიოდი არ უნდა იყოს ძალიან დაშორებული დროში, რათა შედარების შედეგებზე არ იყოს ზედმეტად ძლიერი გავლენა ტექნოლოგიისა და მომხმარებლის ჩვევების ცვლილებებმა. ფასების ინდექსი გამოითვლება ფორმულით:

სადაც მე მე- ფასების ინდექსი ში მეწელი, მე- ფასი შევიდა მეწელი, P ბაზები- ფასი საბაზისო წელს.

ფასების ინდექსი - პროდუქტის (ან პროდუქტების ჯგუფის) ფასის პროცენტული ცვლილება დროის მოცემულ პერიოდში პროდუქტის ფასთან მიმართებაში დროის საბაზისო მომენტში. მაგალითად, განვიხილოთ უტყვი ბენზინის ფასების ინდექსი შეერთებულ შტატებში 1980 წლიდან 2002 წლამდე (ნახ. 24). Მაგალითად:

ბრინჯი. 24. უტყვი ბენზინის ფასი გალონზე და აშშ-ს მარტივი ფასების ინდექსი 1980 წლიდან 2002 წლამდე (საბაზისო წლები 1980 და 1995 წლები)

ასე რომ, 2002 წელს აშშ-ში უტყვი ბენზინის ფასი 4,8%-ით მეტი იყო 1980 წელთან შედარებით. Analysis of ნახ. 24 აჩვენებს, რომ ფასების ინდექსი 1981 და 1982 წლებში იყო 1980 წელს ფასების ინდექსზე მაღლა, შემდეგ კი 2000 წლამდე არ აღემატებოდა საბაზისო დონეს. ვინაიდან საბაზო პერიოდად არჩეულია 1980 წელი, ალბათ აზრი აქვს უფრო ახლო წლის არჩევას, მაგალითად, 1995. ინდექსის ხელახალი გამოთვლის ფორმულა ახალ საბაზისო პერიოდთან მიმართებაში არის:

სადაც მეახალი- ახალი ფასების ინდექსი, მეძველი- ძველი ფასების ინდექსი, მეახალიბაზა - ფასის ინდექსის მნიშვნელობა ახალ საბაზისო წელს, როდესაც გამოითვლება ძველი საბაზისო წლისთვის.

დავუშვათ, რომ ახალ ბაზად 1995 წელია არჩეული. ფორმულის (10) გამოყენებით, ჩვენ ვიღებთ ახალი ფასების ინდექსს 2002 წლისთვის:

ასე რომ, 2002 წელს აშშ-ში უტყვი ბენზინი 13,9%-ით მეტი ღირდა, ვიდრე 1995 წელს.

შეუწონავი კომპოზიტური ფასების ინდექსები.მიუხედავად იმისა, რომ ფასების ინდექსი ნებისმიერი ინდივიდუალური პროდუქტისთვის უდავო ინტერესს იწვევს, საქონლის ჯგუფის ფასების ინდექსი უფრო მნიშვნელოვანია, რაც საშუალებას გაძლევთ შეაფასოთ მომხმარებელთა დიდი რაოდენობის ღირებულება და ცხოვრების დონე. არაწონიანი კომპოზიციური ფასების ინდექსი, რომელიც განსაზღვრულია ფორმულით (11), ანიჭებს ერთსა და იმავე წონას საქონლის თითოეულ ინდივიდუალურ ტიპს. შედგენილი ფასების ინდექსი ასახავს საქონლის ჯგუფის (ხშირად მოხსენიებული, როგორც სამომხმარებლო კალათის) ფასის პროცენტულ ცვლილებას დროის მოცემულ პერიოდში ამ ჯგუფის საქონლის ფასთან შედარებით დროის საბაზისო მომენტში.

სადაც მე- საქონლის ნომერი (1, 2, ..., ), - საქონლის რაოდენობა განსახილველ ჯგუფში, - ფასების ჯამი თითოეულზე საქონელი გარკვეული პერიოდის განმავლობაში , არის თითოეული მათგანის ფასების ჯამი საქონელი ნულოვანი პერიოდის განმავლობაში, - დაუწონავი კომპოზიტური ინდექსის მნიშვნელობა დროის მონაკვეთში .

ნახ. 25 წარმოდგენილია სამი სახის ხილის საშუალო ფასები 1980 წლიდან 1999 წლამდე. სხვადასხვა წლებში შეუწონავი კომპოზიტური ფასების ინდექსის გამოსათვლელად გამოიყენება ფორმულა (11) საბაზისო 1980 წლის გათვალისწინებით.

ასე რომ, 1999 წელს, ფუნტი ვაშლის, ფუნტი ბანანის და ფუნტი ფორთოხლის საერთო ფასი 59,4%-ით აღემატებოდა ამ ხილის მთლიან ფასს 1980 წელს.

ბრინჯი. 25. ფასები (დოლარებში) სამი ხილისა და შეუწონავი კომპოზიციური ფასების ინდექსი

არაწონიანი კომპოზიციური ფასების ინდექსი გამოხატავს ფასების ცვლილებებს საქონლის მთელი ჯგუფისთვის დროთა განმავლობაში. მიუხედავად იმისა, რომ ამ ინდექსის გამოთვლა მარტივია, მას აქვს ორი განსხვავებული ნაკლი. ჯერ ერთი, ამ ინდექსის გაანგარიშებისას ყველა სახის საქონელი ერთნაირად მნიშვნელოვანია, ამიტომ ძვირადღირებული საქონელი არასაჭირო გავლენას ახდენს ინდექსზე. მეორეც, ყველა საქონელი არ მოიხმარება ერთი და იგივე ტემპით, ამიტომ მცირე მოხმარებული საქონლის ფასების ცვლილება ზედმეტად მოქმედებს დაუწონებელ ინდექსზე.

შეწონილი კომპოზიტური ფასების ინდექსები.არაშეწონილი ფასების ინდექსების უარყოფითი მხარეებიდან გამომდინარე, უპირატესობა ენიჭება შეწონილ ფასების ინდექსებს სამომხმარებლო კალათის შემადგენელი საქონლის ფასებისა და მოხმარების დონის განსხვავებების გათვალისწინებით. არსებობს ორი ტიპის შეწონილი ფასების ინდექსები. ლაპეირის ფასების ინდექსიფორმულით (12) განსაზღვრული, იყენებს მოხმარების დონეს საბაზისო წელს. შეწონილი კომპოზიტური ფასების ინდექსი ითვალისწინებს საქონლის მოხმარების დონეებს, რომლებიც ქმნიან სამომხმარებლო კალათას, თითოეულ პროდუქტს ანიჭებს გარკვეულ წონას.

სადაც - დროის პერიოდი (0, 1, 2, ...), მე- საქონლის ნომერი (1, 2, ..., ), მედროის ნულოვან პერიოდში, - ლაპეირის ინდექსის მნიშვნელობა დროის მონაკვეთში .

ლაპეირის ინდექსის გამოთვლები ნაჩვენებია ნახ. 26; 1980 გამოიყენება როგორც საბაზისო წელი.

ბრინჯი. 26. სამი სახის ხილის ფასები (დოლარებში), რაოდენობა (მოხმარება ფუნტებში ერთ სულ მოსახლეზე) და ლაპეირის ინდექსი.

ასე რომ, ლაპეირის ინდექსი 1999 წელს არის 154,2. ეს იმაზე მეტყველებს, რომ 1999 წელს ეს სამი სახეობის ხილი 54,2%-ით უფრო ძვირი იყო, ვიდრე 1980 წელს. გაითვალისწინეთ, რომ ეს ინდექსი 159.4-ის დაუწონებელ ინდექსზე ნაკლებია, რადგან ფორთოხალი, ყველაზე ნაკლებად მოხმარებული ხილი, უფრო მეტად გაიზარდა ვიდრე ვაშლი და ბანანი. სხვა სიტყვებით რომ ვთქვათ, იმის გამო, რომ ყველაზე მეტად მოხმარებული ხილის ფასები ფორთოხლის ფასზე ნაკლები გაიზარდა, ლაპეირეტის ინდექსი უფრო მცირეა, ვიდრე შეუწონავი კომპოზიციური ინდექსი.

პააშეს ფასების ინდექსიიყენებს პროდუქტის მოხმარების დონეს მიმდინარე პერიოდში და არა საბაზისო პერიოდში. აქედან გამომდინარე, პააშეს ინდექსი უფრო ზუსტად ასახავს საქონლის მოხმარების მთლიან ღირებულებას დროის მოცემულ მომენტში. თუმცა, ამ ინდექსს ორი მნიშვნელოვანი ნაკლი აქვს. პირველ რიგში, როგორც წესი, მიმდინარე მოხმარების დონის განსაზღვრა რთულია. ამ მიზეზით, ბევრი პოპულარული ინდექსი იყენებს Lapeyret ინდექსს, ვიდრე Paasche ინდექსს. მეორე, თუ სამომხმარებლო კალათაში კონკრეტული საქონლის ფასი მკვეთრად მოიმატებს, მომხმარებლები შეამცირებენ მოხმარებას აუცილებლობის გამო და არა გემოვნების ცვლილების გამო. პააშეს ინდექსი გამოითვლება ფორმულით:

სადაც - დროის პერიოდი (0, 1, 2, ...), მე- საქონლის ნომერი (1, 2, ..., ), - საქონლის რაოდენობა განსახილველ ჯგუფში, - საქონლის ერთეულების რაოდენობა მედროის ნულოვან პერიოდში, - პაასშეს ინდექსის მნიშვნელობა დროის მონაკვეთში .

პააშეს ინდექსის გამოთვლები ნაჩვენებია ნახ. 27; 1980 გამოიყენება როგორც საბაზისო წელი.

ბრინჯი. 27. სამი სახის ხილის ფასები (დოლარებში), რაოდენობა (მოხმარება ფუნტებში ერთ სულ მოსახლეზე) და პააშეს ინდექსი.

ასე რომ, პააშეს ინდექსი 1999 წელს არის 147.0. ეს მიუთითებს იმაზე, რომ 1999 წელს ეს სამი სახეობის ხილი 47,0%-ით უფრო ძვირი იყო, ვიდრე 1980 წელს.

ზოგიერთი პოპულარული ფასების ინდექსი.ფასების რამდენიმე ინდექსი გამოიყენება ბიზნესსა და ეკონომიკაში. ყველაზე პოპულარულია სამომხმარებლო ფასების ინდექსი (CPI). ოფიციალურად, ამ ინდექსს უწოდებენ CPI-U, რათა ხაზი გავუსვა, რომ იგი გამოითვლება ქალაქებისთვის (ურბანული), თუმცა, როგორც წესი, მას უბრალოდ CPI-ს უწოდებენ. ამ ინდექსს ყოველთვიურად აქვეყნებს აშშ-ს შრომის სტატისტიკის ბიურო, როგორც პირველადი ინსტრუმენტი შეერთებულ შტატებში ცხოვრების ღირებულების გასაზომად. სამომხმარებლო ფასების ინდექსი არის კომპოზიტური და ლაპეირის შეწონილი. ის გამოითვლება 400 ყველაზე ფართოდ მოხმარებული პროდუქტის, ტანსაცმლის, ტრანსპორტის, ჯანდაცვისა და კომუნალური მომსახურების ფასების გამოყენებით. ამ ინდექსის გაანგარიშებისას ამ დროისთვის საბაზო პერიოდად გამოიყენება 1982–1984 წლები. (სურ. 28). CPI ინდექსის მნიშვნელოვანი ფუნქციაა მისი გამოყენება დეფლატორად. CPI ინდექსი გამოიყენება ფაქტობრივი ფასების რეალურ ფასებში გადასაყვანად თითოეული ფასის 100/CPI კოეფიციენტზე გამრავლებით. გამოთვლები აჩვენებს, რომ ბოლო 30 წლის განმავლობაში, საშუალო წლიური ინფლაციის დონე შეერთებულ შტატებში 2,9% იყო.

ბრინჯი. 28. სამომხმარებლო ინდექსის ფასის დინამიკა; სრული მონაცემები იხილეთ Excel ფაილი

კიდევ ერთი მნიშვნელოვანი ფასების ინდექსი, რომელიც გამოქვეყნებულია შრომის სტატისტიკის ბიუროს მიერ, არის მწარმოებლის ფასების ინდექსი (PPI). PPI ინდექსი არის შეწონილი კომპოზიტური ინდექსი, რომელიც იყენებს ლაპეირეტის მეთოდს მათი მწარმოებლების მიერ გაყიდული საქონლის ფასის ცვლილების შესაფასებლად. PPI ინდექსი არის CPI ინდექსის წამყვანი მაჩვენებელი. სხვა სიტყვებით რომ ვთქვათ, PPI ინდექსის ზრდა იწვევს CPI ინდექსის ზრდას და პირიქით, PPI ინდექსის შემცირება იწვევს CPI ინდექსის შემცირებას. ფინანსური ინდექსები, როგორიცაა Dow Jones Industrial Average (DJIA), S&P 500 და NASDAQ, გამოიყენება აშშ-ს აქციების ღირებულების ცვლილების გასაზომად. ბევრი ინდექსი საშუალებას გაძლევთ შეაფასოთ საერთაშორისო მომგებიანობა საფონდო ბაზრებზე. ამ ინდექსებში შედის Nikkei იაპონიაში, Dax 30 გერმანიაში და SSE Composite ჩინეთში.

დროის ანალიზთან დაკავშირებული პრობლემები x რიგები

მეთოდოლოგიის მნიშვნელობა, რომელიც იყენებს ინფორმაციას წარსულისა და აწმყოს შესახებ მომავლის პროგნოზირებისთვის, მჭევრმეტყველად იყო აღწერილი ორასზე მეტი წლის წინ სახელმწიფო მოხელე პატრიკ ჰენრიმ: ”მე მხოლოდ ერთი ნათურა მაქვს გზის გასანათებლად - ჩემი გამოცდილება. მხოლოდ წარსულის ცოდნა იძლევა მომავლის განსჯის საშუალებას.

დროის სერიების ანალიზი ემყარება დაშვებას, რომ ფაქტორები, რომლებიც გავლენას ახდენდნენ ბიზნეს საქმიანობაზე წარსულში და გავლენას ახდენდნენ აწმყოზე, მომავალშიც გააგრძელებენ მოქმედებას. თუ მართალია, დროის სერიების ანალიზი ეფექტური პროგნოზირებისა და მართვის ინსტრუმენტია. თუმცა, დროის სერიების ანალიზზე დაფუძნებული კლასიკური მეთოდების კრიტიკოსები ამტკიცებენ, რომ ეს მეთოდები ძალიან გულუბრყვილო და პრიმიტიულია. სხვა სიტყვებით რომ ვთქვათ, მათემატიკური მოდელი, რომელიც ითვალისწინებს წარსულში მოქმედ ფაქტორებს, არ უნდა მოახდინოს მექანიკურად ექსტრაპოლაცია მომავალში ტენდენციების გათვალისწინების გარეშე ექსპერტთა განსჯის, ბიზნეს გამოცდილების, ტექნოლოგიური ცვლილებებისა და ადამიანების ჩვევებისა და საჭიროებების გათვალისწინების გარეშე. ამ სიტუაციის გამოსწორების მცდელობისას, ბოლო წლებში ეკონომეტრიკოსებმა შეიმუშავეს ეკონომიკური საქმიანობის რთული კომპიუტერული მოდელები, რომლებიც ითვალისწინებენ ზემოთ ჩამოთვლილ ფაქტორებს.

თუმცა, დროის სერიების ანალიზის მეთოდები არის შესანიშნავი პროგნოზირების ინსტრუმენტი (როგორც მოკლევადიანი, ასევე გრძელვადიანი), თუ სწორად გამოიყენება, პროგნოზირების სხვა მეთოდებთან ერთად და ექსპერტების განსჯის და გამოცდილების გათვალისწინებით.

Შემაჯამებელი.შენიშვნაში, დროის სერიების ანალიზის გამოყენებით, შემუშავდა მოდელები სამი კომპანიის შემოსავლის პროგნოზირებისთვის: Wm. Wrigley Jr. კომპანია, Cabot Corporation და Wal-Mart. აღწერილია დროის სერიების კომპონენტები, ასევე წლიური დროის სერიების პროგნოზირების რამდენიმე მიდგომა - მოძრავი საშუალო მეთოდი, ექსპონენციალური დაგლუვების მეთოდი, წრფივი, კვადრატული და ექსპონენციალური მოდელები, ასევე ავტორეგრესიული მოდელი. განიხილება რეგრესიული მოდელი, რომელიც შეიცავს სეზონურ კომპონენტს შესაბამისი ცვლადებს. ნაჩვენებია უმცირესი კვადრატების მეთოდის გამოყენება ყოველთვიური და კვარტალური დროის სერიების პროგნოზირებისთვის (ნახ. 29).

თავისუფლების P ხარისხი იკარგება დროის სერიების მნიშვნელობების შედარებისას.

დროის სერიების ანალიზი (TSA) არის დამოკიდებულების აღდგენის უმარტივესი მეთოდი დეტერმინისტულ შემთხვევაში, მოცემულ დროის სერიაზე დაფუძნებული. მთავარი ამოცანაა ექსტრაპოლაცია (პროგნოზი) - ბაზრის მდგომარეობის პროგნოზირების უმარტივესი გზა. მისი არსი არის წარსულში და მომავალში განვითარებული ტენდენციების გავრცელება.

ბევრ საბაზრო პროცესს აქვს ინერცია, რაც გათვალისწინებულია პროგნოზებში. გარკვეული პერიოდის განმავლობაში მაქსიმალურად უნდა იყოს გათვალისწინებული საბაზრო პირობების ცვლილების ალბათობა. ვარაუდობენ, რომ სისტემა ვითარდება საკმაოდ სტაბილურ პირობებში. რაც უფრო დიდია სისტემა, მით უფრო სავარაუდოა, რომ პარამეტრები უცვლელი დარჩეს, მაგრამ არა დიდი ხნის განმავლობაში. რეკომენდირებულია, რომ საპროგნოზო პერიოდი არ უნდა აღემატებოდეს საწყისი დროის ბაზის სიგრძის 1/3-ს.

დროის სერიები - რიცხვითი მნიშვნელობების სერია, რომლებიც მიიღება დროის რეგულარულ ინტერვალებში. ძირითადი დაშვება, რომელსაც ეფუძნება დროის სერიების გამოყენება საწარმოში, არის ის, რომ ფაქტორები, რომლებიც გავლენას ახდენენ შესწავლილი სისტემის პასუხზე, მოქმედებენ წარსულში, აწმყოში და ანალოგიურად იმოქმედებს უახლოეს მომავალში.

ანალიზის მიზანია ფაქტორების შეფასება და იდენტიფიცირება სისტემის შემდგომი ქცევის პროგნოზირებისა და რაციონალური SD-ის განვითარების მიზნით. ATS-ზე დაფუძნებული პროგნოზი მოკლევადიანია, იმ პერიოდთან მიმართებაში, რომელიც მიღებულია, შესასწავლი ფენომენის მახასიათებლები მნიშვნელოვნად არ იცვლება. პროგნოზის შეცდომების უმეტესობა გამოწვეულია იმით, რომ პროგნოზი ითვალისწინებს წარსული ტენდენციების გაგრძელებას მომავალში. ეს ჰიპოთეზა იშვიათად არის გამართლებული ეკონომიკურ და სოციალურ ცხოვრებაში.

VR შეიძლება იყოს ცუდი საფუძველი პროგნოზის შემუშავებისთვის; ამიტომ, პროგნოზირების მეთოდები და AVR გამოიყენება საკმაოდ სტაბილური და კარგად შესწავლილი პროცესების მოკლევადიანი პროგნოზირებისთვის. საპროგნოზო პერიოდი არ აღემატება საწყისი დროის ბაზის 25-30%-ს. რეგრესიის განტოლების გამოყენებისას ტარდება პროგნოზირებადი გამოთვლები საწყისი პარამეტრების ოპტიმისტური და პესიმისტური შეფასებისთვის. აქედან მიიღება 2 ტიპის პროგნოზი: ოპტიმისტური და პესიმისტური. პროგნოზირების მეთოდებიდან მიღებული პროგნოზირების ქულა გამოიყენება პროგნოზირების პარამეტრის სასურველი მნიშვნელობის ინდიკატორად.

VR მოიცავს:

1) ტენდენცია - გვიჩვენებს ცვლილების ზოგად ტიპს, გრძელვადიან შემცირებას და ზრდას სერიაში,

2) სეზონური რყევები - რყევები ტენდენციის გარშემო, რომელიც რეგულარულად ხდება.

როგორც წესი, რეგულარული რყევები ხდება ერთ წლამდე პერიოდში. თვალყურის დევნება შესაძლებელია კვარტალურად, ყოველთვიურად, ყოველკვირეულად და ა.შ. დაკვირვებები.

3) ციკლური რყევები - ხდება წელიწადზე მეტი პერიოდის განმავლობაში. ხშირად წარმოდგენილია ფინანსურ მონაცემებში და ასოცირდება მკვეთრ კლებასთან, სწრაფ ზრდასთან და სტაგნაციის პერიოდთან.


4) შემთხვევითი რყევები - არაპროგნოზირებადი რყევები უმეტეს რეალურ VR-ში.

მოთხოვნები დროის სერიების მონაცემებზე

პროგნოზირების ყველა მეთოდი იყენებს მათემატიკურ სტატისტიკას, ამიტომ აუცილებელია, რომ ყველა მონაცემი იყოს შესადარებელი, საკმარისად წარმოდგენილი ერთიანი და სტაბილური შაბლონების გამოსავლენად. ამ მოთხოვნებიდან ერთ-ერთის შეუსრულებლობა მათემატიკური სტატისტიკის გამოყენებას უაზრო ხდის.

1. შედარებამიიღწევა დროის სერიების ფორმირების სხვადასხვა საფეხურზე დაკვირვებებისადმი ერთიდაიგივე მიდგომის შედეგად. დროის სერიებში მონაცემები უნდა იყოს გამოხატული იმავე საზომი ერთეულებით, ჰქონდეს იგივე დაკვირვების საფეხური, გამოითვალოს ერთი და იგივე დროის ინტერვალზე ერთი და იგივე მეთოდოლოგიით, მოიცავდეს იმავე ტერიტორიის კუთვნილ და იმავე პოპულაციასთან დაკავშირებული იგივე ელემენტებს.

მონაცემთა შეუთავსებლობა ყველაზე ხშირად ვლინდება ხარჯების ინდიკატორებში. იმ შემთხვევებშიც კი, როდესაც ამ მაჩვენებლების მნიშვნელობები ფიქსირდება მუდმივ ფასებში. დროის სერიების ამგვარი შეუთავსებლობა არ შეიძლება აღმოიფხვრას წმინდა ფორმალური მეთოდებით.

2. მონაცემთა რეპრეზენტაციულობახასიათდება პირველ რიგში წარმოდგენილი მონაცემების სისრულით. დაკვირვების საკმარისი რაოდენობა განისაზღვრება კვლევის მიზნიდან გამომდინარე. თუ მიზანი არის აღწერილობითი სტატისტიკური ანალიზი, მაშინ თქვენ მიერ არჩეული ნებისმიერი დროის ინტერვალი შეიძლება აირჩეს შესასწავლად დროის ინტერვალად. თუ კვლევის მიზანია პროგნოზირების მოდელის აგება, მაშინ საწყის დროის სერიებში მონაცემთა რაოდენობა უნდა იყოს მინიმუმ 3-ჯერ საპროგნოზო პერიოდზე და არ უნდა იყოს 7 მონაცემზე ნაკლები. სეზონურობის შესასწავლად და სეზონური პროცესების პროგნოზირებისთვის კვარტალური ან თვიური მონაცემების გამოყენების შემთხვევაში, საწყისი დროის სერია უნდა შეიცავდეს კვარტალურ ან თვიურ მონაცემებს მინიმუმ 4 წლის განმავლობაში, მაშინაც კი, თუ პროგნოზი საჭიროა 1 ან 2 თვის განმავლობაში.

3.ერთგვაროვნება- ატიპიური ანომალიური დაკვირვებების არარსებობა, ასევე ტენდენციების შეფერხება (ცვლილება). ანომალია იწვევს შეფასებების მიკერძოებას და, შედეგად, ანალიზის შედეგების დამახინჯებას. ფორმალურად, ანომალია ვლინდება როგორც ძლიერი ნახტომი ან დაცემა, რასაც მოჰყვება წინა დონის სავარაუდო აღდგენა. შემუშავებულია სხვადასხვა სტანდარტული კრიტერიუმები ანომალიური დაკვირვებების დიაგნოსტიკისთვის.

4. მდგრადობა- ეს თვისება ასახავს კანონზომიერების უპირატესობას შემთხვევითობას დონისა და სერიების ცვლილებებში. სტაბილური დროის სერიების სქემებზე კანონზომიერება ვიზუალურადაც კი ჩანს. და არასტაბილური დროის სერიების სქემებზე ცვლილებები ქაოტურად არის წარმოდგენილი. მაშასადამე, ასეთ დროის სერიებში ნიმუშების ძიებას აზრი არ აქვს.

დროის სერიების მოდელები

სტატისტიკური კვლევის მეთოდები ეფუძნება ვარაუდს, რომ შესაძლებელია დროის სერიების მნიშვნელობების წარმოდგენა რამდენიმე კომპონენტის ერთობლიობაში, რაც ასახავს განვითარების კანონზომიერებას და შემთხვევითობას. კერძოდ, მოკლევადიანი პროგნოზებისთვის გამოიყენება დანამატი (ადაპტაციური) და მრავლობითი მოდელები.

1. ადაპტური (დამატებითი)

Y(t) = T(t) + S(t) + F(t)

t - დროის ინტერვალის ნომერი

T(t) – განვითარების ტენდენცია (გრძელვადიანი ტენდენცია)

S(t) - სეზონური კომპონენტი

Е(t) – ნარჩენი კომპონენტი

2. მრავლობითი

Y(t) = T(t)*S(t)*F(t)

როდესაც სეზონური ტალღის ამპლიტუდა ერთი ძლიერია, მიზანშეწონილია გამოიყენოთ დანამატის მოდელი. სეზონური ტალღის ამპლიტუდის შეცვლისას გამოიყენება მულტიპლიკაციური მოდელი საშუალო დონის ტენდენციის შესატყვისად. ზოგჯერ გამოიყენება შერეული ტიპის მოდელები, ისინი იძლევა უფრო ზუსტ შედეგს, მაგრამ ცუდად არის განმარტებული შინაარსის თვალსაზრისით. მულტიპლიკაციური მოდელის გამოყენება განპირობებულია იმით, რომ ზოგიერთ დროის სერიაში სეზონური კომპონენტის მნიშვნელობა წარმოადგენს ტრენდის მნიშვნელობის გარკვეულ პროპორციას. პრაქტიკა გვიჩვენებს, რომ იმ შემთხვევებში, როდესაც შესწავლილი პროცესის სეზონური რყევები დიდია და არც ისე სტაბილურია, მულტიპლიკაციური მოდელი იძლევა ცუდ შედეგებს. სეზონური კომპონენტი ახასიათებს დონეების სტაბილურ და წლიურ რყევებს - ის გამოიხატება კვარტალური ან ყოველთვიური მონაცემებით წარმოდგენილ ზოგიერთ ინდიკატორში.

დანამატისა და მულტიპლიკაციური კომპონენტების მქონე მოდელებში ზოგადი ანალიზის პროცედურა დაახლოებით იგივეა.

საჭიროა გავაკეთოთ:

1) სეზონური კომპონენტის მნიშვნელობების გაანგარიშება

2) სეზონური კომპონენტის გამოკლება ფაქტობრივი მნიშვნელობებისგან - ამ პროცესს ეწოდება დესეზონალიზაცია (სეზონურობის აღმოფხვრა)

3) შეცდომების გაანგარიშება, როგორც განსხვავება რეალურ და ტრენდულ მნიშვნელობებს შორის

4) საშუალო გადახრის ან სტანდარტული შეცდომის გამოთვლა

ასევე გამოიყენება პროგნოზირება ზრდის მრუდის მოდელები.

ზრდის მრუდები არის მათემატიკური ფუნქციები, რომლებიც შექმნილია დროის სერიების ანალიტიკური გასწორებისთვის.

შემდეგი ფუნქციები გამოიყენება ზრდის მრუდების აღსაწერად

2. პარაბოლა Y(t) = a+bt =ct 2

3. ჰიპერბოლა Y(t) = a + b/t

4. ძალა

5. დემონსტრაცია

6. ლოგარითმული

7. ჯონსონის მრუდი

8. მოდიფიცირებული გამოფენა

დროის სერიების დაგლუვება

განვითარების ძირითადი ტენდენციის იდენტიფიკაციას ეწოდება დროის სერიების გასწორება ან გასწორება. ძირითადი ტენდენციის იდენტიფიცირების მეთოდებია გათანაბრების მეთოდები.

ფენომენის განვითარების ზოგადი ტენდენციის გამოვლენის ერთ-ერთი მარტივი მეთოდია დინამიური სერიის ინტერვალის გაფართოება. განვითარების ტენდენციების დასადგენად გამოიყენება მოძრავი საშუალო მეთოდი ან ექსპონენციალური დაგლუვების მეთოდი. ორივე მეთოდი სუბიექტურია დამარბილებელი პარამეტრების არჩევასთან დაკავშირებით. და სწორედ პარამეტრების სწორ არჩევანში ვლინდება მკვლევარის ინტუიცია.

მოძრავი საშუალო მეთოდი– უკიდურესად სუბიექტურია და დამარბილების შედეგებზე ძლიერ გავლენას ახდენს დამარბილებელი პერიოდის ხანგრძლივობა. მოკლე პერიოდებში შეუძლებელია ტენდენციის კომპონენტის იდენტიფიცირება. დიდი პერიოდის განმავლობაში, მნიშვნელოვანი მონაცემების დაკარგვა ხდება გაანალიზებული ინტერვალის ბოლოს.

ბრძანების L მოძრავი საშუალო არის დროის სერია, რომელიც შედგება არითმეტიკისა და არითმეტიკული საშუალო L-სგან Y ფუნქციის მიმდებარე მნიშვნელობებში ყველა შესაძლო დროის მნიშვნელობებზე. როგორც L - კენტი რიცხვი, 3, 5.7 - სამქულიანი, ხუთქულიანი და შვიდქულიანი.

სამპუნქტიანი სქემა: საშუალო მნიშვნელობა გამოითვლება 3 Yi მნიშვნელობიდან, რომელთაგან ერთი ეხება გასულ პერიოდს, მეორე სასურველ პერიოდს და 3 მომავალ პერიოდს. თუ i = 1 არ არის წარსული მნიშვნელობა, მაშინ შეუძლებელია გათლილი მნიშვნელობის გამოთვლა პირველ წერტილში. i = 2-ისთვის, მაშინ საშუალო მნიშვნელობა იქნება საშუალო არითმეტიკული.

თავდაპირველი ინტერვალის ბოლო წერტილში, მოძრავი საშუალო ასევე არ შეიძლება გამოითვალოს გამოთვლილთან მიმართებაში მომავალი მნიშვნელობის არარსებობის გამო.

ექსპონენციალური დაგლუვების მეთოდი– მოძრავი საშუალოსგან განსხვავებით, ის შეიძლება გამოყენებულ იქნას მოკლევადიანი პროგნოზებისთვის სამომავლო ტრენდში ერთი პერიოდის წინ. ამიტომ მეთოდს აშკარა უპირატესობა აქვს წინასთან შედარებით.

სერიის ნებისმიერ წერტილში გათლილი მნიშვნელობების გამოთვლის ალგორითმი ემყარება 3 მნიშვნელობას: Yi-ს დაკვირვებულ მნიშვნელობას მოცემულ წერტილში, გამოთვლილ გათლილ მნიშვნელობას სერიის წინა წერტილისთვის და რამდენიმე წინასწარ განსაზღვრულ დამარბილებელ კოეფიციენტებს, რომლებიც მუდმივია. მთელი სერიის განმავლობაში.

Fi = α*Yi +(α-1)*Fi

Yi არის სერიის ბოლო წერტილის რეალური მნიშვნელობა.

გამარტივებული მნიშვნელობა სერიის წინა წერტილისთვის - (ალფა-1)

ალფას შეუძლია მიიღოს ნებისმიერი მნიშვნელობა 0-დან 1-მდე, მაგრამ პრაქტიკაში ჩვეულებრივ შემოიფარგლება 0.2-დან 0.5-მდე ინტერვალით.

ჰოლტის მეთოდი. L t =k*Y t +(1-k)*(L t-1 -T t-1), სადაც

L t არის გათლილი მნიშვნელობა მიმდინარე პერიოდისთვის;

K არის სერიის დამარბილების კოეფიციენტი;

Y t არის სერიის მიმდინარე მნიშვნელობა (მაგალითად, გაყიდვების მოცულობა);

L t-1 – გათლილი მნიშვნელობა წინა პერიოდისთვის;

T t-1 – ტენდენციის მნიშვნელობა წინა პერიოდისთვის.

მაგიდა excelსაწყისი მონაცემებით აქვს შემდეგი ფორმა (ნახ. 2.33).

ბრინჯი. 2.33. მაგიდა excelსაწყისი მონაცემებით

დროის სერიების ანალიზისას ფართოდ გამოიყენება გრაფიკული მეთოდები. ეს გამოწვეულია იმით, რომ დროის სერიების და აღწერილობითი მახასიათებლების ცხრილური პრეზენტაცია ყველაზე ხშირად არ იძლევა პროცესის ბუნების გაგებას და გარკვეული დასკვნების გამოტანა შესაძლებელია დროის სერიების გრაფიკიდან, რომელიც შემდეგ შეიძლება დადასტურდეს გამოთვლების გამოყენებით. სერიის გრაფიკული ანალიზი ჩვეულებრივ ადგენს მიმართულებას მისი შემდგომი ანალიზისთვის.

აირჩიეთ უჯრედების დიაპაზონი A2:K2 და გამოიყენეთ ბრძანება განრიგიჩანართები ჩასმა(სურ. 2.34), შექმენით გრაფიკი (სურ. 2.35).


ბრინჯი. 2.34. ჩანართი ჩასმა. ბრძანება განრიგი

ბრინჯი. 2.35. გრაფიკი - ავტომობილების გაყიდვის დინამიკა

ტრენდის ხაზის ჩასმამდე მიიღეთ სქემის კიდევ ოთხი ეგზემპლარი ისე, რომ თითოეული ტიპის ტრენდის ხაზი გამოსახული იყოს ცალკე დიაგრამაზე. ტრენდის ხაზის ჩასართავად, დააწკაპუნეთ მაუსის მარჯვენა ღილაკით დიაგრამის მონაცემთა ერთ-ერთ მნიშვნელობაზე და აირჩიეთ ბრძანება ტენდენციის ხაზის დამატება, როგორც ნაჩვენებია ნახ. 2.36.

ბრინჯი. 2.36. ბრძანება ტენდენციის ხაზის დამატება

კონტექსტური მენიუ

დიალოგურ ფანჯარაში ტრენდლაინის ფორმატი(ნახ. 2.37) შეირჩევა შემოთავაზებული ტრენდის ხაზის ტიპები და გააქტიურებულია ოფციები აჩვენე განტოლება დიაგრამაზედა მოათავსეთ დიაგრამაზე მიახლოების სანდოობის მნიშვნელობა.

ბრინჯი. 2.37. არჩეულია ტრენდლაინის ვარიანტები

შედეგად ვიღებთ შემდეგი ტიპის გრაფიკებს (სურ. 2.38 -2.).

ბრინჯი. 2.38. ტრენდული ხაზის ტიპი - ხაზოვანი

ბრინჯი. 2.39. ტრენდული ხაზის ტიპი - ლოგარითმული

ბრინჯი. 2.40. ტრენდის ხაზის ტიპი - მრავალწევრი

ბრინჯი. 2.41. ტრენდული ხაზის ტიპი - Ძალა

ბრინჯი. 2.42. ტრენდის ხაზის ტიპი - ექსპონენციალური

მიახლოებით ფუნქციად აირჩიეს მეორე ხარისხის პოლინომი - პარაბოლა, რადგან მას აქვს უდიდესი მნიშვნელობა. R2\u003d 0.9905, ამ ტიპის ტენდენცია გამოიყენება პროგნოზის შესაქმნელად ორი ნაბიჯით წინ (ნახ. 2.43). ჩვენს მაგალითში გაყიდული მანქანების რაოდენობა პროგნოზირებულია მე-11 და მე-12 კვირებში (ნახ. 2.44).

ბრინჯი. 2.43. პროგნოზი ორი პერიოდის წინ

ბრინჯი. 2.44. იწინასწარმეტყველე ორი პერიოდი

ასევე, პროგნოზის შესაქმნელად, შეგიძლიათ გამოიყენოთ ჩაშენებული სტატისტიკური ფუნქცია TREND. შევავსოთ L1:M1 უჯრედების დიაპაზონი შესაბამისად 11 და 12. ვინაიდან TREND ფუნქცია პასუხების მასივს იძლევა, მის დაძახებამდე უნდა აირჩიოთ პასუხების დიაპაზონი, ჩვენს შემთხვევაში L2:M2. ღილაკის გამოყენება ფუნქციის ოსტატებიგამოიძახეთ ფუნქციის დიალოგური ფანჯარა და შეავსეთ არგუმენტის ველები, როგორც ნაჩვენებია ნახ. 2.45.

ბრინჯი. 2.45. სტატისტიკური ფუნქცია TREND

ფორმულის შეყვანის დასრულების შემდეგ: =TREND(B2:K2;B1:K1;L1:M1) დააჭირეთ კლავიშთა კომბინაციას Ctrl+Shift+Enter.

გაანგარიშების შედეგი ნაჩვენებია შემდეგ ფიგურაში. 2.46.

ჩვენ მივიღეთ შემდეგი პროგნოზი, თუ კომპანია შეინარჩუნებს ავტომობილების გაყიდვის დინამიკას, მაშინ მე-11 კვირაში გაყიდის 78 მანქანა, ხოლო მე-12 კვირაში - 84.

ხაზოვანი რეგრესია

ცხრილი შეიცავს ორ დროის სერიას: პირველი მათგანი წარმოადგენს მოგებას, რომელიც იზრდება კვარტალურად კომერციული ბანკი (ზე), მეორე რიგი - ამ ბანკის საპროცენტო განაკვეთი იურიდიული პირების დაკრედიტებაზე ( X) იმავე პერიოდისთვის (ცხრილი 3).

საჭირო:

1. შექმენით ერთფაქტორიანი რეგრესიის მოდელი;

2. შეაფასეთ ბანკის მოგება მოცემულზე (მომხმარებლის მიერ დამოუკიდებლად მიღებული) საპროცენტო განაკვეთი;

3. გრაფიკზე გამოტანა საწყისი მონაცემები, სიმულაციის შედეგები.

ცხრილი 3

ცხრილი წყაროს მონაცემებით excelაქვს შემდეგი ფორმა (სურ. 2.47).


ბრინჯი. 2.47. ცხრილი საწყისი მონაცემებით

მოდელის პარამეტრების გამოსათვლელად შევადგენთ შემდეგი ფორმის საანგარიშო ცხრილს (ნახ. 2.48).


ბრინჯი. 2.48. გაანგარიშების ცხრილი

იგივე ცხრილი ფორმულის ჩვენების რეჟიმში გამოიყურება, როგორც ნაჩვენებია შემდეგ ნახ. 2.49.


ბრინჯი. 2.49. გაანგარიშების ცხრილი რეჟიმში

ფორმულის ჩვენება

უჯრედებში C19 და C20 შეიტანეს ფორმულები პარამეტრების გამოსათვლელად a 1და a 0(ნახ. 2.50):

ბრინჯი. 2.50. პარამეტრების გამოთვლის ფორმულები a 1და a 0

თავად პარამეტრების მნიშვნელობები ნაჩვენებია ნახ. 2.51.

ბრინჯი. 2.51. პარამეტრის მნიშვნელობები a 1და a 0

საპროცენტო განაკვეთზე მოგების დამოკიდებულების აგებულ მოდელს აქვს ფორმა:

30%-იანი საპროცენტო განაკვეთით მოგების დასადგენად აუცილებელია ღირებულების ჩანაცვლება Xმიღებულ მოდელს.

შემდეგი ფორმულა შეყვანილია უჯრედში C22 (სურათი 2.52):

ბრინჯი. 2.52. საპროგნოზო მოგების გამოთვლის ფორმულა

მოგების საპროგნოზო ღირებულება იქნება 13 ათასი რუბლი. (ნახ. 2.53).

ბრინჯი. 2.53. მოგების საპროგნოზო ღირებულება

გამოვთვალოთ ნარჩენების ცხრილი (სურ. 2.54).


ბრინჯი. 2.54. ნარჩენების მაგიდა

ნარჩენების ცხრილს ფორმულის ჩვენების რეჟიმში აქვს შემდეგი ფორმა (ნახ. 2.55).


ბრინჯი. 2.55. დარჩენილი ცხრილი ფორმულის ჩვენების რეჟიმში

რეგრესიის ხაზიდან გადახრის ოდენობა გამოითვლება შემდეგი ფორმულით:

C38 უჯრედში შეყვანილია ფორმულა გადახრის მნიშვნელობის გამოსათვლელად ჩაშენებული მათემატიკური ფუნქციის ROOT (ნახ. 2.56) გამოყენებით.


ბრინჯი. 2.56. ჩამონტაჟებული მათემატიკის ფუნქცია SQRT

გადახრა რეგრესიის ხაზიდან არის 3.4401 (სურათი 2.57).

ბრინჯი. 2.57. რეგრესიის ხაზიდან გადახრის რაოდენობა

შემდეგ ეტაპზე გამოითვლება პროგნოზის ზედა ზღვარი და ქვედა. ნდობის ინტერვალის გამოსათვლელად ვიყენებთ შემდეგ ფორმულას:

,

რომელიც შედის C40 უჯრედში.

კოეფიციენტი ტაარის ცხრილის მნიშვნელობა – სტუდენტთა სტატისტიკა მნიშვნელობის მოცემულ დონეზე და დაკვირვებების რაოდენობა. თუ დავაყენებთ ალბათობას, რომ პროგნოზირებული მნიშვნელობა მოხვდება ნდობის ინტერვალში, უდრის 90% ( = 0.01), თავისუფლების გრადუსების რაოდენობა დფ= 10-1-1, მაშინ ტა=1,8595.

მნიშვნელობა U=6.804 (ნახ. 2.58).

ბრინჯი. 2.58. ნდობის ინტერვალის მნიშვნელობა

პროგნოზის ზედა და ქვედა საზღვრების გამოსათვლელად, შესაბამისად, შეიყვანეთ ფორმულები C42 და C43 უჯრედებში, როგორც ნაჩვენებია შემდეგ სურათზე. 2.59.

ბრინჯი. 2.59. პროგნოზის ლიმიტების გამოთვლის ფორმულები

პროგნოზის ზედა ზღვარი 19,81 ათასი რუბლია, ქვედა - 6,20 ათასი რუბლი. (ნახ. 2.60).

ბრინჯი. 2.60. საპროგნოზო სასაზღვრო მნიშვნელობები

საწყისი მონაცემების გრაფიკი და სიმულაციის შედეგები ნაჩვენებია ნახ. 2.61.

ბრინჯი. 2.61. დაწყვილებული რეგრესიის მოდელის ნაკვეთი

მოდელის პარამეტრების გამოსათვლელად შეიძლება ასევე გამოიყენოთ ჩაშენებული სტატისტიკური ფუნქციები, როგორიცაა SLOPE, INTERCEPT, LINEST, STOCH და ა.შ.

SLOPE ფუნქცია ითვლის რეგრესიის ხაზის დახრილობას, ჩვენს მაგალითში ეს არის პარამეტრი a 1.

INTERCEPT ფუნქცია ითვლის პარამეტრს a 0.

LINEST ფუნქცია აფასებს ორივე პარამეტრს ერთდროულად. ფუნქციაში შესვლამდე აირჩიეთ პასუხების დიაპაზონი (ორი უჯრედი) და ფუნქციის არგუმენტების შევსების შემდეგ დააჭირეთ კლავიშთა კომბინაციას. Ctrl+Shift+Enter.

STOSHUT ფუნქცია ითვლის სტანდარტულ შეცდომას, ჩვენს მაგალითში ეს არის მნიშვნელობა სი.

ჩაშენებული სტატისტიკური ფუნქციის SLOPE დიალოგური ფანჯარა შეყვანილი არგუმენტებით ნაჩვენებია ნახ. 2.62.


ბრინჯი. 2.62. ჩამონტაჟებული SLOPE სტატისტიკური ფუნქცია

ჩაშენებული სტატისტიკური ფუნქციის INTERCEPT დიალოგური ფანჯარა შეყვანილი არგუმენტებით ნაჩვენებია ნახ. 2.63.


ბრინჯი. 2.63. ჩაშენებული სტატისტიკური INTERCEPT

ჩაშენებული სტატისტიკური ფუნქციის LINEST დიალოგური ფანჯარა შეყვანილი არგუმენტებით ნაჩვენებია ნახ. 2.64.


ბრინჯი. 2.64. ჩამონტაჟებული სტატისტიკური ფუნქცია LINEST

ჩაშენებული სტატისტიკური ფუნქციის STOSHUKH დიალოგური ფანჯარა შეყვანილი არგუმენტებით ნაჩვენებია ნახ. 2.65.


ბრინჯი. 2.65. ჩამონტაჟებული სტატისტიკური ფუნქცია

ჩაშენებული სტატისტიკური ფუნქციების გამოთვლების შედეგი ნაჩვენებია ნახ. 2.65.


ბრინჯი. 2.66. ჩაშენებული სტატისტიკური ფუნქციების გამოთვლების შედეგი

თქვენ ასევე შეგიძლიათ გამოიყენოთ ანალიზის პაკეტის ჩაშენებული ინსტრუმენტი მოდელის შესაქმნელად. რეგრესია. ამისათვის, ჩანართზე მონაცემებიაირჩიეთ გუნდი Მონაცემთა ანალიზი(ნახ. 2.67).

ბრინჯი. 2.67. ჩანართი მონაცემები. ბრძანება Მონაცემთა ანალიზი

დიალოგურ ფანჯარაში, რომელიც გამოჩნდება Მონაცემთა ანალიზიინსტრუმენტის შერჩევა რეგრესია(ნახ. 2.68).


ბრინჯი. 2.68. დიალოგის ფანჯარა Მონაცემთა ანალიზი.

ხელსაწყო რეგრესია

შეავსეთ დიალოგური ფანჯრის არგუმენტები რეგრესია, როგორც ნაჩვენებია სურათზე 2.69.

ბრინჯი. 2.69. ხელსაწყოს პარამეტრები რეგრესია

excelგამოიმუშავებს მოხსენების ფურცელს, რომელიც შეიცავს შემდეგ ცხრილებს:

რეგრესიის სტატისტიკა (ნახ. 2.70);

დისპერსიის ანალიზი (ნახ. 2.71 - 2.72);

ნარჩენების ცხრილი (ნახ. 2.73),

და ასევე ავაშენოთ ნარჩენების გრაფიკი (სურ. 2.74).

ბრინჯი. 2.70. რეგრესიის სტატისტიკა


ბრინჯი. 2.71. დისპერსიის ანალიზი


ბრინჯი. 2.72. დისპერსიული ანალიზი. კოეფიციენტების მნიშვნელობები


ბრინჯი. 2.73. ბალანსის ამოღება

ნარჩენების განრიგს აქვს შემდეგი ფორმა (ნახ. 2.74).

ბრინჯი. 2.74. ნარჩენების სქემა

ამ ამოცანის შესრულებისას, წყვილის რეგრესიის განტოლების კოეფიციენტების მნიშვნელობები a 1და a 0განისაზღვრა სამი გზით: უმცირესი კვადრატების მეთოდით, ჩაშენებული სტატისტიკური ფუნქციების გამოყენებით და ხელსაწყოს გამოყენებით რეგრესია. თითოეულ შემთხვევაში მიღებულ იქნა ერთი და იგივე შედეგი, რაც მიუთითებს ამ პარამეტრების გაანგარიშების სისწორეზე.