۱ -۶-۲-۱- شبکه عصبی درک چند لایه ۱۰
۱-۶-۳- الگوریتم ژنتیک ۱۲
۱-۶-۳-۱- استخراج قانون از شبکه عصبی با بهره گرفتن از الگوریتم ژنتیک ۱۳
۱-۶-۴- روش ترکیبی تبدیل موجک- شبکه عصبی و ARIMA 15
۱-۶-۴-۱- تبدیل فوریه ۱۵
۱-۶-۴-۲- تبدیل موجک ۱۶
۱-۷- ابعاد کلی تحقیق ۱۸
۱-۷-۱- روش تحقیق ۱۸
۱-۷-۲- جامعه و نمونه آماری تحقیق ۱۹
۱-۷-۳- جنبه نوآوری تحقیق ۱۹
۱-۸- ساختار کلی تحقیق ۲۰
۱-۹- خلاصه فصل ۲۱
فصل دوم: مروری بر مبانی نظری و ادبیات تحقیق
۲-۱- مقدمه ۲۳
۲-۲- مبانی نظری پژوهش ۲۴
۲-۲-۱- تئوری سرمایه گذاری در بازار بورس ۲۴
۲-۲-۲- قابلیت پیش بینی و فرضیه بازار کارا ۲۵
۲-۲-۳- شکل ضعیف نظریه بازار کارا ۲۶
۲-۲-۴- شکل نیمه قوی نظریه بازار کارا ۲۷
۲-۲-۵- شکل قوی نظریه بازار کارا ۲۸
۲-۲-۶- مطالعات صورت گرفته بر روی کارایی بازار ۳۰
۲-۲-۷- مطالعات تجربی سطح ضعیف کارایی در بورس اوراق بهادار تهران ۳۱
۲-۲-۸- روشهای پیش بینی ۳۲
۲-۲-۸-۱- تحلیل فنی ۳۲
۲-۲-۸-۲- تحلیل بنیادی ۳۳
۲-۲-۸-۳- پیش بینیهای سری زمانی کلاسیک ۳۴
۲-۲-۸-۴- روشهای هوشمند ۳۵
۲-۲-۸-۵- جمع بندی روش های هوشمند ۳۶
۲-۲-۹- شاخص قیمت سهام ۳۸
۲-۲-۱۰- تعریف شاخص ۳۹
۲-۲-۱۱- فواید شاخص ۴۰
۲-۲-۱۲- شاخص قیمت بورس تهران ۴۰
۲-۲-۱۳- ویژگیهای TEPIX 42
۲-۲-۱۴- شاخص های فرعی در بورس اوراق بهادار تهران ۴۳
۲-۲-۱۴-۱- شاخص صنایع ۴۳
۲-۲-۱۴-۲- شاخص شرکت ۴۴
۲-۲-۱۴-۳- شاخص ۵۰ شرکت با بیشترین ارزش ۴۴
۲-۳- پیشینه تحقیق ۴۴
۲-۳-۱- مطالعات داخلی ۴۵
۲-۳-۲- مطالعات خارجی ۵۰
۲-۴- نتیجه گیری و خلاصه فصل ۵۷
فصل سوم: روش تحقیق
۳-۱- مقدمه ۶۰
۳-۲- روش تحقیق ۶۰
۳-۳- جامعه آماری و متغیرهای تحقیق ۶۱
۳-۳-۱- جامعه آماری ۶۱
۳-۳-۲- متغیرهای تحقیق ۶۱
۳-۴- سوالات و فرضیه های تحقیق ۶۲
۳-۵- آماده سازی داده های ورودی ۶۳
۳-۶- معرفی مدلهای تحقیق ۶۴
۳-۶-۱- مدل سری زمانی خطی ARIMA 65
۳-۶-۲- شبکه پرسپترون چند لایه (MLP) 65
۳-۶-۳-الگوریتم ژنتیک ۷۱
۳-۶-۴- استخراج قانون از شبکه عصبی ۷۵
۳-۶-۵-تبدیل موجک ۷۸
۳-۶-۵-۱-موجک مادر ۷۹
۳-۷- معیارهای ارزیابی عملکرد ۸۳
۳-۸-خلاصه فصل ۸۴
فصل چهارم: تجزیه و تحلیل داده ها
۴-۱- مقدمه ۸۶
۴-۲- آزمون فرضیه اول ۸۶
۴-۳- آزمون فرضیه دوم ۸۸
۴-۴- آزمون فرضیه سوم ۹۰
۴-۵- آزمون فرضیه چهارم ۹۴
۴-۶- آزمون فرضیه پنجم ۹۶
۴-۷- خلاصه فصل ۹۹
فصل پنجم: نتایج و پیشنهادات
۵-۱- مقدمه ۱۰۱
۵-۲-مقایسه عملکرد مدلهای پیش بینی ۱۰۱
۵-۳- نتایج آزمون فرضیات ۱۰۳
۵-۴- نتیجه گیری ۱۰۴
۵-۵- محدودیتهای تحقیق ۱۰۶
۵-۶- پیشنهادات تحقیق ۱۰۷
۵-۶-۱- پیشنهادات برای سرمایه گذاران و متولیان بازار ۱۰۷
۵-۶-۲- پیشنهادات برای تحقیقات آتی ۱۰۸
منابع و ماخذ ۱۰۹
فهرست جداول
عنوان صفحه
جدول ۴-۱: نتایج ارزیابی عملکرد مدل ARIMA 87
جدول ۴-۲: پارامترهای ساختار شبکه نهایی MLP 88
جدول ۴-۳: نتایج ارزیابی عملکرد شبکه MLP 89
جدول ۴-۴: پارامترهای الگوریتم ژنتیک ۹۲
جدول ۴-۵: قوانین استخراج شده از شبکه عصبی ۹۲
جدول ۴-۶: نتایج ارزیابی عملکرد الگوریتم استخراج قانون ۹۳
جدول ۴-۷: پارامترهای ساختار شبکه MLP 95
جدول ۴-۸: نتایج ارزیابی عملکرد مدل ترکیبی شبکه عصبی- ARIMA 95
جدول ۴-۹: پارامترهای ساختار شبکه MLP 97
جدول ۴-۱۰: پارامترهای الگوریتم ژنتیک مورد استفاده ۹۷
جدول ۴-۱۱: مجموعه قوانین استخراج شده از مدل ترکیبی تبدیل موجک –شبکه عصبی ۹۷
جدول ۴-۱۲: نتایج ارزیابی عملکرد الگوریتم استخراج قانون از مدلWNN 98
جدول ۵-۱: نتایج مقایسه روش های پیش بینی مورد استفاده ۱۰۲
جدول ۵-۲: نتایج فرضیه های مطرح شده ۱۰۳
فهرست تصاویر
عنوان صفحه
شکل ۱-۱: نمایش تبدیل فوریه ۱۵
شکل ۱-۲: مفهوم فیلتر شدن یک سیگنال ۱۷
شکل ۱-۳: مفهوم نمونه برداری با نرخ پایین ۱۸
شکل ۲-۱: مفهوم ترکیب شدن ۳۴
شکل ۳-۱: ساختار شبکه MLP 69
شکل ۳-۲: تبادل ژنتیکی ۷۳
شکل ۳-۳: ساختار الگوریتم ژنتیک ۷۴
شکل ۳-۴: مفهوم استخراج قانون از شبکه عصبی ۷۵
شکل ۳-۵: الگوریتم ژنتیک فازی ۷۷
شکل ۳-۶: موجک خانواده دبوچی ۷۸
شکل ۳-۷: تجریه یک سیگنال بوسیله تبدیل موجک ۷۹
شکل ۳-۸: ساختار مدل ترکیبی ۸۰
شکل ۴-۱: مقایسه مقادیر واقعی و مقادیر پیش بینی مدلARIMA 87
شکل ۴-۲: مقایسه مقادیر واقعی و مقادیر پیش بینی مدلMLP 89
شکل ۴-۳: تابع عضویت متغیر شاخص قیمت ۹۰
شکل ۴-۴: تابع عضویت متغیر شاخصS&P500 90
شکل ۴-۵: تابع عضویت متغیر قیمت طلا ۹۱
شکل ۴-۶: تابع عضویت متغیر ارز دولتی ۹۱
شکل ۴-۷: تابع عضویت متغیر قیمت سبد نفتی ایران ۹۱
شکل ۴-۸: مقایسه مقادیر واقعی و مقادیر پیش بینی الگوریتم استخراج قانون ۹۳
شکل ۴-۹: مقایسه مقادیر واقعی و مقادیر پیش بینی مدلWNN-ARIMA 96
شکل ۴-۱۰: مقایسه مقادیر واقعی و مقادیر پیش بینی الگوریتم استخراج قانون از مدلWNN 98
شکل ۵-۱: نمودار مقایسه روش های پیش بینی ۱۰۲
فصل اول
مقدمه و
کلیات طرح تحقیق
۱-۱: مقدمه
رفع نا آگاهی از آینده از اصلی ترین دغدغه های خاطر انسان در طول تاریخ بوده است . آدمی همیشه به دنبال آن بوده که از آینده خود آگاه شده و آن را به نحوی که خود می خواهد سازمان دهد. در ابتدا چون توان پیش بینی صحیح و قابل اطمینان فراهم نبود، انسان متوسل به نیروهای فراطبیعی شد و آنگاه که توانایی عقلایی بیشتری پیدا کرد، درصدد استفاده از این توانایی برآمد و چون علم امکاناتی برای پیش بینی های او فراهم آورد، از این دستاورد بهره جست.(قدیری مقدم، ۱۳۸۸)
امروزه با رشد و توسعه اقتصاد جهانی و رقابتی شدن آن، تصمیم گیری درخصوص تخصیص بهینه منابع به مراتب بیش از پیش اهمیت پیدا کرده است. از این رو بازار بورس و اوراق بهادار به عنوان آینهی تمام نمای وضعیت اقتصادی کشورها و مکانی برای اینکه سرمایه گذاران بتوانند منابع و پس انداز خود را در آن سرمایه گذاری کنند، بیشترین توجه را به خود جلب کرده است.
تصمیمات مربوط به آینده، همواره با ابهام و عدم اطمینان روبروست و کسانی در رقابت پیروز می شوند که بتوانند آینده را پیش بینی و حداقل اطلاعاتی در خصوص آن داشته باشند و بر اساس آن اقدام به تصمیم گیری نمایند. با گسترش علم، امکان پیش بینی مطلوب آینده فراهم شده است. یکی از راه های کمک به سرمایه گذاران، ارائه الگوهای پیش بینی وضعیت بازار است. هرچه پیش بینی به واقعیت نزدیک تر باشد، مبنای تصمیمات صحیح تری قرار خواهد گرفت.
پیش بینی آینده در عرصه پویای اقتصاد و بازار سرمایه یکی از مهمترین مسائل مورد بحث درعلوم مالی بوده است. معمولاً به منظور پیش بینی وقایعی که در آینده اتفاق می افتد به اطلاعات به دست آمده از رویدادهای تاریخی اتکا می شود .به این ترتیب که داده های گذشته تجزیه و تحلیل می گردد تا از آن الگویی قابل تعمیم به آینده حاصل گردد، دراغلب روش های پیش بینی فرض بر این است که روابط بین متغیرها در آینده نیز ادامه خواهد داشت.(فلاح شمس، ۱۳۸۸)
بازار های مالی، به عنوان بخش مهم اقتصاد هر کشور ، بدلیل رابطه تنگاتنگ آن با ساختار اقتصادی، بسیار مورد توجه قرارگرفته اند. بورس اوراق بهادار نیز به عنوان یکی از مهمترین عناصر بازار سرمایه و توسعه اقتصادی هر کشور شناخته شده است. چرا که این بازار به عنوان پیش نیازی برای بسیاری از تحولات بازرگانی و اقتصادی مورد توجه است. تامین مالی پروژه های مالی – سرمایه ای بلند مدت از محل پس اندازها و نقدینگی بخش خصوصی در مطلوبترین شکل ممکن از طریق بورس اوراق بهادار تحقق می یابد.
۱-۲: بیان مساله
سرمایه گذاران حق دارند نسبت به آیندهی سرمایه گذاری خود نگران و حساس باشند، به این ترتیب به دنبال این هستند تا اطلاعاتی در مورد آینده بدست آورند. پیش بینی به سرمایه گذاران و تخصیص دهندگان منابع در تصمیم گیری صحیح کمک می کند و ریسک سرمایه گذاری را تا حد امکان کاهش می دهد. بیور می گوید":پیش بینی ها را می توان بدون اخذ تصمیم انجام داد ولی کوچکترین تصیم گیری را نمی توان بدون پیش بینی انجام داد".
روشن است که خصوصیت عدم اطمینان، امر نامطلوبی است و از طرفی برای سرمایه گذارانی که بازار بورس را به عنوان مکان سرمایه گذاری انتخاب نموده اند، این خصوصیت اجتناب ناپذیر است. بنابراین بطور طبیعی تمام تلاش های سرمایه گذار کاهش عدم اطمینان است و از این جهت پیش بینی بازار بورس یکی از ابزارهای کاهش عدم اطمینان می باشد.
یکی از مفروضات مهمی که در بازارهای مالی وجود دارد، فرضیه بازار کارا است. بر اساس این فرضیه قیمت اوراق بهادار به ارزش ذاتی آنها نزدیک است، یعنی قیمت تعیین شده دربازار شاخص مناسبی از ارزش واقعی اوراق بهادار است.(جهانخانی،۱۳۷۶) از جمله مواردی که فرضیه بازار کارا را ضعیفتر می کند، قابلیت پیش بینی در این بازارها است. (نمازی،۱۳۸۶) آنچه سرمایه گذاران اعم از حقیقی و حقوقی را برای سرمایه گذاری در سهام شرکتها نگران می کند، نوسانات شدید قیمت های سهام میباشد.
پیش بینی قیمت سهام یکی از مهمترین و جذاب ترین فعالیت ها برای مدیران داخلی و سرمایه گذاران خارجی شرکت می باشد. در خارج از شرکت، سرمایه گذاران از این پیش بینی به عنوان اساس و مبنای انتخاب سبد سرمایه گذاری(پرتفولیو[۱]) بهینه و سودآور استفاده می کنند؛ از طرف دیگر در داخل شرکت، هدف مدیران که حداکثر سازی ثروت سهامدارن بوده از این پیش بینی در اتخاذ تصمیمات مهم و بحرانی از جمله بودجه بندی عملیاتی، سرمایه ای و تخصیص بهینه منابع به منظور دستیابی به اهداف سازمان استفاده می کنند. بنابراین روشن است که دقت پیش بینی قیمت سهام بسیار مهم و حیاتی است؛ زیرا مبنای تصمیم گیری های داخلی و خارجی قرار می گیرد. از این رو انتخاب روش پیش بینی یکی از مهم ترین تصمیمات پیش بینی کنندگان است.
بیشتر مطالعاتی که در گذشته در مورد پیش بینی قیمت انجام شده، از مدل سازی خطی و غیر خطی برای پیش بینی استفاده کرده و به مقایسه و بررسی دقت این روش ها پرداختند. در این تحقیق قصد داریم با بهره گرفتن از ترکیب مدل های غیرخطی(تبدیل موجک[۲]، شبکه های عصبی[۳] و الگوریتم ژنتیک[۴]) و مدلهای خطی به مدل سازی پیش بینی قیمت سهام بپردازیم.
۱-۳: ضرورت و اهمیت تحقیق
سرمایه گذاری و انباشت سرمایه در تحول اقتصادی کشور نقش بسزایی داشته است. اهمیت این عامل و نقش موثر آن را می توان به وضوح در سیستم کشورهایی با نظام سرمایه داری مشاهده کرد. بدون شک بورس یکی از مناسب ترین جایگاهها جهت جذب سرمایه های کوچک و استفاده از آنها جهت رشد یک شرکت، در سطح کلان و نیز رشد شخصی فرد سرمایه گذار است. از آنجایی که هدف و تعریف سرمایه گذاری، به تعویق انداختن مصرف جهت مصرف بیشتر در آینده است، افراد با سرمایه گذاری انتظار دستیابی به سود مورد انتظار خود را دارند. بنابراین مهمترین امر در این زمینه، خرید یک سهم به قیمت پایین و فروش آن به قیمت بالاتر است که این موضوع به معنی پیش بینی قیمت سهام است.
از دوران گشایش بازارهای اوراق بهادار همواره این فکر وجود داشته است که به کمک روشی، قیمت سهام را پیش بینی کنند و در این راه سخت افزارها و نرم افزارها، تحلیل های متفاوت مالی و مانند اینها ابداع شده و مورد استفاده قرار گرفت.(حق پرست،۱۳۸۶)
۱-۴: اهداف تحقیق
هدف اصلی تحقیق، ارائه مدلی برای پیش بینی قیمت سهام با بکارگیری شبکه عصبی درک چندلایه[۵] و تکنیک استخراج قانون از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک[۶] و ترکیب مدلهای مزبور با مدل خطی [۷]ARIMA در شرکت های عضو بورس و اوراق بهادار تهران است. علاوه بر هدف اصلی تحقیق، اهداف فرعی دیگری نیز مورد نظر هستند که در سطح پایین تری از هدف اصلی قرار می گیرند. این اهداف عبارتند از:
-کمک به سرمایه گذاران جهت اتخاذ تصمیم های صحیح و مطلوب
-کمک به مدیران برای انجام وظیفهی حداکثر سازی ثروت سهامدارن
-تعیین مدل بهینه از میان مدل های فوق برای پیش بینی قیمت سهام
۱-۵: سؤالات و فرضیه های تحقیق
پس از بررسی مسئله و اهداف تحقیق و مطالعات مقدماتی درباره پاسخ های احتمالی، سؤالات تحقیق به شرح زیر قابل طرح است:
- آیا سری زمانی خطی ARIMA مدل مناسبی برای پیش بینی قیمت سهام است؟
- آیا شبکه عصبی درک چند لایه(MLP) در پیش بینی قیمت سهام بر مدل خطی ARIMA برتری دارد؟
- آیا تکنیک استخراج قانون(ExtractionRule ) از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد؟
- آیا تکنیک استخراج قانون(ExtractionRule ) از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک در پیش بینی قیمت سهام بر شبکه عصبی درک چند لایه(MLP) برتری دارد؟
- آیا ترکیب مدل ARIMA با شبکه عصبی برای پیش بینی قیمت سهام با بهره گرفتن از تبدیل موجک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد؟
- آیا مدل ترکیبی تبدیل موجک، شبکه عصبی و الگوریتم ژنتیک فازی در پیش بینی شاخص قیمت نسبت به بقیه مدلهای ارائه شده از دقت بالاتری برخوردار است؟
بنابراین فرضیات اصلی تحقیق به صورت زیر خواهد بود:
فرضیه۱) مدل خطی ARIMA مدل مناسبی برای پیش بینی قیمت سهام بدست می دهد.
فرضیه۲) شبکه عصبی درک چند لایه(MLP) در پیش بینی قیمت سهام از مدل خطی ARIMA عملکرد بهتری را نشان می دهد.
فرضیه۳) تکنیک استخراج قانون(ExtractionRule ) از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد.
فرضیه۴) مدل ترکیبی ARIMA، شبکه عصبی درک چند لایه و تبدیل موجک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد.
فرضیه۵) مدل ترکیبی تبدیل موجک، شبکه عصبی درک چند لایه و الگوریتم ژنتیک فازی در مقایسه با سایر مدلها ارائه شده از دقت بالاتری برخوردار است.
۱-۶: روش انجام تحقیق
هدف اصلی تحقیق حاضر، پیش بینی قیمت سهام با بهره گرفتن از مدل سری زمانی خطی ARIMA و شبکه عصبی و همچنین ترکیب شبکه عصبی درک چندلایه یا تکنیک استخراج قانون از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک و استفاده از تبدیل موجک برای ترکیب مدل خطی ARIMA و شبکه عصبی و همچنین استخراج قانون از مدل ترکیبی تبدیل موجک عصبی و تعیین مدل بهینه با مقایسه نتایج حاصل از روشهای پیش بینی مورد استفاده است. تبدیل موجک، شبکه های عصبی و الگوریتم ژنتیک از جدیدترین و پیشرفته ترین روش های مدلسازی و پیش بینی است که چندی است از این روش ها برای پیش بینی فاکتورهای حسابداری و مالی نیز استفاده می شود. در این پژوهش ابتدا پیش بینی شاخص قیمت با بهره گرفتن از مدل سری زمانی ARIMA صورت گرفت، سپس این پیش بینی با بهره گرفتن از شبکه عصبی مصنوعی تکرار شد، در مرحله سوم برای بدست آوردن الگوی شبکه عصبی از الگوریتم ژنتیک فازی استفاده شد، سپس با بهره گرفتن از تبدیل موجک سری زمانی تا سه مرحله شکافته شد، با در نظر گرفتن این نکته که مدلهای خطی در سریهای هموار نتایج بهتری دارند؛ سری همار شده با بهره گرفتن از مدل خطی ARIMA پیش بینی شد و سری تابع جزئیات با بهره گرفتن از شبکه عصبی مصنوعی در انتهای این مرحله با بهره گرفتن از معکوس تبدیل موجک پیش بینیهای صورت گرفته با هم ترکیب شده و پیش بینی سری اصلی حصل گردید و در نهایت در الگوریتم استخراج قانون از شبکه های عصبی(الگوریتم ژنتیک فازی) به جای شبکه عصبی از مدل ترکیبی تبدیل موجک و شبکه عصبی استفاده گردید. در ادامه روشهای مورد استفاده برای پیش بینی به تفکیک توضیح داده می شود.
۱-۶-۱: مدل ARIMA
یک سری زمانی، دنباله ای از مشاهدات منظم شده بر حسب زمان از یک متغیر می باشد. در تجزیه و تحلیل سریهای زمانی تنها از داده های تاریخی متغیری که پیش بینی می شود، استفاده می کنند تا مدلی برای تخمین مقادیر آینده توسعه دهند. پیش بینی بارزترین مورد استفاده از سری زمانی میباشد، اینکار در صنعت و اقتصاد از اهمیت بالایی برخوردار است. از روشهای پیش بینی سری زمانی که در پشبینی کاربرد بسیاری دارد مدل ARIMA میباشد، ولی همانند سایر مدلهای پیش بینی این مدل نیز دارای محدودیتهایی می باشد که در ادامه به برخی از آنها اشاره می شود:
در حال حاضر در مدل ARIMA روش مناسبی وجود ندارد که به محض اینکه مشاهده جدید در دسترس قرار گرفت تخمینهای پارامترهای مدل را اصلاح یا به روز نماید، و تحلیل گر ناگزیر است بطور کامل مدل را از نو برازش نماید. و همچنین پژوهشگر باید فرض نماید که تکامل آینده سری زمانی با گذشته یکسان خواهد بود، یعنی شکل مدل با زمان تغییر نخواهد کرد. عدم امتیاز نهایی مدلهای ARIMA سرمایه گذاری مورد نیاز در زمان و سایر منابع برای ساختن یک مدل رضایت بخش است. ولی این مدلها بخصوص برای سریهای زمانی که در آنها فاصله نمونه گیری خیلی کوچکند، بدلیل اینکه تاریخ نسبتا طولانی یی را به آسانی میتوان تهیه کرد، به نحو شایستهای مناسبند.(فاطمی،۱۳۷۵)
۱-۶-۲: شبکه عصبی مصنوعی
شبکه های عصبی مصنوعی[۸] ابزار مدل بندی انعطاف پذیر و غیر پارامتریک هستند. آنها می توانند هر تابع پیچیده ای را با دقت مورد نظر اجرا کنند. یک شبکه عصبی مصنوعی نوعا از چندین لایه متشکل از تعدادی زیادی عناصر محاسبه گر ساخته شده است که این عناصر محاسبه گر اصطلاحا گره مینامند. هر گره یک سیگنال ورودی از دیگر گره ها، یا ورودی های خارجی دریافت می کند و پس از پردازش سیگنالها بصورت محلی به واسطه یک تابع تبدیل به گره دیگر یا نتیجه نهایی ارسال می کند. لایهی ورودی[۹] و لایهی خروجی[۱۰] شبکه شبیه یک سیستم ورودی-خروجی عمل می کند و ارزش نرون های ورودی را برای محاسبهی ارزش نرون خروجی مورد استفاده قرار می دهد. شبکه های عصبی با لایه های پنهان[۱۱] دارای توانایی های بیشتری نسبت به شبکه های عصبی دو لایه هستند.(منهاج،۱۳۷۷) در شبکه های عصبی ورودی p به نرون اعمال شده از طریق ضرب در وزن w، وزندار می شود و حاصل به تابع انتقال f بعنوان ورودی اعمال شده و خروجی نهایی حاصل میگردد. که در آن اندازه w متناظر با قدرت هر اتصال سیناپسی[۱۲](به نقطه اتصال یک آکسون[۱۳] یک سلول عصبی با دندریت[۱۴] سلولهای عصبی دیگر) در نرونهای موجودات زنده میباشد.(مصطفی کیا،۱۳۸۸) بعبارتی شبکه عصبی وزن بین متغیرهای مستقل و وابسته یعنی میزان رابطه بین آنها را تعیین می نماید.
۱-۶-۲-۱: شبکه عصبی درک چند لایه (MLP)
پرکاربردترین معماری شبکه های عصبی، شبکه های چند لایه پیش خور[۱۵] هستند که معمولا” شبکه های درک چند لایه و به طور اختصار [۱۶]MLPگویند. این نوع شبکه ها دارای مشخصات زیر هستند:
١. پردازنده های شبکه به چند لایه مختلف تقسیم می شوند.
٢. حداقل تعداد لایه ها در این شبکه ها، ٢ است.
٣. پردازنده های هر لایه فقط مجاز به دریافت سیگنال از پردازنده های لایه قبل خود هستند و سیگنال خروجی این پردازنده نیز به پردازنده های بعدی اعمال می شود.
۴. در این شبکه ها به لایه اول، ورودی، به لایه آخر، خروجی و به لایه های میانی ، لایه های پنهان می گویند. ورودی های شبکه پارامتر های مؤثر در تعیین خروجی ها هستند. بنابراین تعداد گره های لایه ورودی و خروجی در حقیقت از همان آغاز استفاده از شبکه معلوم است. تعداد گره های لایهی پنهان و همچنین تعداد لایه های پنهان از طریق سعی و خطا بدست می آید. در حقیقت تعداد مناسب گره ها و لایه های پنهان، وقتی به دست می آید که شبکه بهترین جواب را ارائه دهد.(منافی،۱۳۸۵)
علت اصلی موفقیت این شبکه را بایستی در نوع الگوریتم یادگیری این شبکه جستجو کرد. الگوریتم مورد استفاده در آن ، الگوریتم پس انتشار خطا می باشد. این الگوریتم همواره به دنبال حداقل سازی مربعات خطا می باشد . این دقیقا شبیه تخمین ضرایب رگرسیون از روش OLS در آمار و اقتصاد سنجی می باشد . بنابراین هر شبکه عصبی از یک تابع خطایی همانند رابطه زیر پیروی می کند .
تابع خطا در شبکه MLP :
(۱-۱)
در این رابطه e بیانگر مقدار خطای مشاهده شده می باشد .
هنگام طراحی یک شبکه باید پارامترهای ساختار شبکه، نوع الگوریتم آموزش، نرخ یادگیری، تعداد لایه های شبکه و تعداد نرون ها در هر لایه، و تعداد تکرارها برای هر الگو در خلال آموزش را مد نظر داشت.(اعظمی،۱۳۸۸)
از آنجاییکه عمل پیش بینی در شبکه های عصبی از طریق یادگیری[۱۷] بر روی متغیرهای ورودی انجام می شود، از این رو متغیرهای ورودی یکی از موارد مهم در مدلسازی با بهره گرفتن از شبکه های عصبی و الگوریتم ژنتیک است. از آنجا که بهترین وضعیت برای شبکه های عصبی هنگامی است که تمام ورودی ها و خروجیها بین صفر و یک باشند لذا داده ها با بهره گرفتن از روش ساعتی نرمال شدند. بدین منظور با جمع آوری منابع داخلی و خارجی با بهره گرفتن از روش کتابخانه ای و مطالعه ادبیات تحقیق، چهار متغیر به عنوان متغیرهای ورودی مدل در نظر گرفته شدند:
متغیر های ورودی(مستقل) مورد استفاده در تحقیق
X | شناسه | متغیر |
۱ | GP | قیمت جهانی طلا |
۲ | OP | میانگین قیمت نفت ایران |
۳ | USD | نرخ دولتی دلار آمریکا |
۴ | S&P500 | شاخص S&P500 آمریکا (نماد بورس جهانی) |
مدل دارای یک متغیر خروجی (وابسته) است، و آن هم شاخص قیمت (TEPIX) خواهد بود. داده های روزانه کلیه متغیرهای فوق از تاریخ ۰۶/۰۱/۱۳۸۴لغایت ۲۸/۱۲/۱۳۸۹، مورد بررسی قرار می گیرد. لذا جامعه آماری بورس اوراق بهادار تهران و سال های ۱۳۸۴ لغایت ۱۳۸۹ به عنوان دوره زمانی تحقیق انتخاب شد.
۱-۶-۳: الگوریتم ژنتیک
الگوریتم ژنتیک الهام گرفته از طبیعت است و تکامل طبیعت با فرضیه داروین، اساس شکل گیری آن می باشد که درآن بهترین ها حق بقا دارند.الگوریتم ژنتیک توسط جان هالند [۱۸]متخصص علوم کامپیوتر دانشگاه میشیگان در سال۱۹۶۲ ارائه شد. هالند با ارائه رساله ای با عنوان« تطابق در طبیعت و سیستمهای مصنوعی» به معرفی مفاهیم اصلی GA شامل عملگرهای سه گانهی انتخاب[۱۹]، آمیزش[۲۰] و جهش[۲۱] که در مورد سیستمهای مصنوعی به کار میروند و همچنین مبانی ریاضی الگوریتم ژنتیک پرداخت.(شهابیان و همکاران،۱۳۸۷)
از این الگوریتم، درحل مسائل بهینه سازی پیچیده که نمی توان برای آن قوانین خاصی در نظر گرفت استفاده می شود. برای حل یک مسئله با بهره گرفتن از این روش ابتدا باید پاسخهای فرضی مسئله را به صورت خاصی نمایش داد که برای ادامه کار و ارزیابی پاسخها مشکلی ایجاد نگردد. روشهای متعددی برای نمایش و کدگذاری وجود دارد که از مهمترین و معمولترین آنها روش دودویی و نمایش اعشاری شناور می باشد.(ستایش و همکاران، ۱۳۸۸)
در آغاز، جمعیت اولیه که جواب ها را نشان می دهند به صورت تصادفی انتخاب می گردد. هر یک از اعضای این جمعیت که کروموزم نامیده می شود یکی از پاسخ های مسئله می باشد. هر یک از این کروموزم ها از رشته ای از اعداد با طول برابر انتخاب می گردد که هر یک از این اعداد ژن نام دارد. الگوریتم ژنتیک بر اساس تکرار عمل می کند که به جمعیت در هر مرحله ، نسل گفته میشود. هریک از اعضای این نسل بر اساس تابع ارزش ، ارزیابی می شوند. در این الگوریتم ها نسل جدید سعی دارد که ارزش بیشتری از تابع ارزش را به خود اختصاص دهد و با این عملکرد به تابع هدف نزدیک تر گردد. در هر مرحله از تکرار، هر یک از کروموزم ها با احتمال خاصی با یکدیگر عمل تقاطعی انجام می دهند یا به اصطلاح مزدوج می شوند که پیامد آن یک یا چند کروموزم جدید به نام فرزند می باشد.
در این فرزندان ممکن است طبق احتمال خاصی عمل جهش ژنی اتفاق افتد، به این صورت که مقدار یک یا چند ژن از کروموزم تغییر کند. در مرحله آخر فرزندان طبق تابع ارزش، ارزیابی شده و بر اساس ارزش آنها و ارزش والدین یعنی نسل اولیه که این فرزندان را تولید کرده اند نسل جدید تولید خواهد شد. این مراحل تا جایی تکرار میشود که نسل حاضر به جواب بهینه یا یکی از زیر جوابهای بهینه همگرا گردد.(ایبن و اسمیت[۲۲]،۲۰۰۳)
۱-۶-۳-۱: استخراج قانون از شبکه عصبی با بهره گرفتن از الگوریتم ژنتیک
عیب مهم و اساسی شبکه های عصبی مصنوعی، عدم توانایی در توضیح و تفسیر است.(اندرسون[۲۳] و همکاران،۱۹۹۶) اگر چه شبکه های عصبی در بسیاری از کاربردهای خود، موفقیت آمیز بوده است، اما دانش مربوطه در توابع انتقال و وزن های نرون ها مخفی می شوند.(بولوگنا[۲۴]،۲۰۰۴) به هرحال آنها مشابه جعبه های سیاه ممتد هستند که فهم روش حل یک مسئله توسط شبکه های عصبی را دشوار کرده است.(مانتاس[۲۵] و همکاران،۲۰۰۶) بنابراین اطلاعاتی که توسط شبکه عصبی برای دست یابی به پاسخ، بکار گرفته شده است، برای کاربران شفاف نیست و ممکن است در برخی موارد مسئله ساز شود(هوانگ و ژینگ[۲۶]،۲۰۰۲).
برای حل این مسئله، محققان مایل بودند که یک تکنیک ملموس و قابل فهم برای شبکه های عصبی ایجاد نمایند.آنها اعتقاد داشتند این هدف می تواند با استخراج قانون تولید شده از شبکه های عصبی بدست آید(هوانگ و ژانگ،۲۰۰۲).
از یک دیدگاه می توان تکنیک های استخراج قانون را به سه دسته تقسیم کرد: تجزیه ای[۲۷]، مبتنی بر آموزش[۲۸] و منتخبان[۲۹]. روش تجزیه ای فعالیت و وزن های لایهی پنهان را تجزیه و تحلیل می کند؛ در مقابل، روش مبتنی بر آموزش، شبکه عصبی را به عنوان یک جعبهی سیاه در نظر گرفته و قوانین را با توجه به فعالیت ورودی و خروجی بدست می آورد. هدف این روش استخراج قوانین نمادین است به طوری که ارتباط بین ورودی و خروجی را با دقت بدست می آورد. در نهایت، روش منتخبان، از ترکیب اجزای دو روش فوق پیروی می کند(تیکل[۳۰] و همکاران،۱۹۹۷).
در تکنیک استخراج قانون از شبکه های عصبی با الگوریتم ژنتیک، از الگوریتم های مبتنی بر آموزش و منتخبان، بیشتر استفاده می شود.
۱-۶-۴: روش ترکیبی تبدیل موجک- شبکه عصبی و ARIMA
۱-۶-۴-۱: تبدیل فوریه
همه جا در اطراف ما سیگنالهایی وجود دارند که باید تحلیل شوند. لرزشهای زلزله، صحبت انسانها، نوسان موتورها، تصاویر پزشکی، دادههای مالی، موزیک و بسیاری از انواع دیگر از سیگنالهایی هستند که باید به شکل مناسبی کدگذاری شوند، فشرده شوند، نویزهایشان تصفیه شوند، بازسازی شوند، بیان شوند، ساده شوند، متمایز شوند و یا محل یابی شوند. تحلیل موجک[۳۱] یک ابزار جدید و تکنیک مناسب برای این کارها میباشد.
تحلیل سیگنال هم اکنون مهمترین دوره مصرف خود را میگذراند و شاید یکی از شناختهشدهترین روش های تحلیل سیگنال تبدیل فوریه باشد. تبدیل فوریه یک سیگنال را به شکل موجهای سینوسی تشکیلدهندهاش در فرکانسهای مختلف تجزیه میکند. نوعی دیگر نگرش به تبدیل فوریه این است که تبدیل فوریه را یک تکنیک ریاضی برای انتقال دید یا نگاه به سیگنال از حوزه زمان به حوزه فرکانس در نظر گرفت.
شکل ۱-۱: نمایش تبدیل فوریه
تحلیل فوریه دارای یک کاستی جدی میباشد. در انتقال یک سیگنال از حوزه زمان به حوزه فرکانس، اطلاعات حوزه زمان سیگنال از دست میرود. هنگام نگاه کردن به تبدیل فوریه یک سیگنال غیرممکن است که بتوان گفت درچه زمانی حوادث در سیگنال اتفاق افتاده است. این مسئله در یک سیگنال ایستا[۳۲]مهم نیست (سیگنال ایستا به سیگنالی گفته میشود که در طی زمان تغییر زیادی نکند)، اما بسیاری از سیگنالهای مهم و موردتوجه شامل تعداد نامتناهی از سیگنالهای غیرایستا یا گذرا میباشد مانند پیشامدها، تغییرات ناگهانی، ابتدا و انتهای زمان رخ دادن حوادث و … . این مشخصه ها اغلب مهمترین قسمت سیگنال میباشند. اما متأسفانه تحلیل فوریه برای تشخیص آنها مناسب نیست.
۱-۶-۴-۲: تبدیل موجک
تحلیل موجک قادر به نمایش سیگنال به وسیله یک تکنیک پنجرهبندی نواحی با سایزهای مختلف میباشد. تحلیل موجک امکان استفاده از پنجرههای زمانی بزرگ را در هنگام نیاز به اطلاعات دقیق در فرکانسهای پایین و پنجرههای زمانی کوچکتر هنگامی که نیاز به اطلاعات فرکانس بالاست را مقدور میسازد. تحلیل موجک قابلیت آشکارسازی مفاهیم مختلف دادهها را دارد که تکنیکهای دیگر تحلیل سیگنال آنها را از دست میدهند. مفاهیمی از قبیل تمایل، نقاط شکست، نشانه، نقاط انفصال و منشاء آنها و … را میتوان با تحلیل موجک آشکارسازی نمود و این موضوع بدلیل نگاه متفاوت این روش به دادهها نسبت به روش های قبلی میباشد. تحلیل موجک همچنین قادر به فشرده سازی و نویززدایی سیگنال بدون اینکه افت محسوسی در کیفیت سیگنال ایجاد کند میباشد.
آنالیز موجک قادر به تجزیهی سریهای زمانی، در مقیاسهای زمانی مختلف میباشد (این و همکاران[۳۳]، ۲۰۰۸)؛ به طوری که با تحلیلهای فرکانس زمانی، کاربردهای فراوانی را در مدلسازی سریهای زمانی اقتصادی و مالی فراهم آورده (جنسای و همکاران[۳۴]، ۲۰۰۲) و به صورت گسترده در سریهای زمانی غیر ایستا به کار بسته شده است (ناسون و ون ساچس[۳۵]، ۱۹۹۹). در آنالیز موجک، سیگنال به صورت ترکیب خطی از توابع موجک نشان داده می شود (سفتر و همکاران[۳۶]، ۲۰۰۷، ۲۰۰۸)، به طوری که. بر اساس طول داده ها، دو موج اصلی موجک ها وجود دارد: اولین موج، تبدیل موجک پیوسته ([۳۷]CWT)، که برای کار با سریهای زمانی تعریف شده بر روی محور حقیقی کامل طراحی شده است؛ موجک دوم، تبدیل موجک گسسته ([۳۸]DWT) میباشد که در جداسازی سری داده در اجزاء فرکانس متفاوت، به منظور آزمایش عمق سری داده مطالعه می شود (کونلون و همکاران[۳۹]، ۲۰۰۸). مراحل فیلتر کردن یک سیگنال در موجک ها بصورت شکل زیر میباشد:
شکل ۱-۲: مفهوم فیلتر شدن سیگنال توسط موجکها
سیگنال اصلی S از دو فیلتر مکمل میگذرد و دو سیگنال از فیلترها خارج میشود. متأسفانه اگر این مراحل بر روی یک سیگنال حقیقی دیجیتال انجام شود با دوبرابر تعداد دادهای که با آن آغاز کردیم مواجه خواهیم شد. فرض کنید سیگنال اصلی S شامل ۱۰۰۰ نمونه داده باشد. آنگاه مقادیر تقریبی و جزئی هرکدام شامل ۱۰۰۰ نمونه خواهد بود و مقدار کلی نمونهها ۲۰۰۰ عدد خواهد شد.
برای تصحیح این مسئله مفهوم نمونهبرداری با نرخ پایین[۴۰] معرفی میشود شکل زیر این موضوع را نشان میدهد.
شکل ۱-۳: مفهوم نمونه برداری با نرخ پایین
در این تحقیق سری زمانی شاخص قیمت سهام با بهره گرفتن از موجک دبوچی تا سه مرحله تجزیه شد بطوریکه سری هموار شده ازسری توابع جزئیات جدا شد و سپس بر اساس روش ARIMA سری اصلی و سری توابع جزئیات با بهره گرفتن از شبکه عصبی پیش بینی شد.
۱-۷: ابعاد کلی تحقیق
۱-۷-۱: روش تحقیق
تحقیق از نظر هدف (از نظر دلیل انجام): توصیفی- تحلیلی
فرایند، روش جمع آوری و تحلیل داده ها: کمی
منطق استنتاج: استقرایی
تحقیق از نظر هدف(نتایج) : کاربردی
روش و ابزار گرآوری اطلاعات (جمع آوری داده ها): میدانی
روش و ابزار گرآوری اطلاعات (درمورد ادبیات تحقیق): کتابخانه ای
از آنجایی که در این تحقیق امکان دستکاری متغیرهای مستقل جهت مشاهده اثرات این تغییرات در متغیر وابسته برای محقق وجود ندارد، این نوع تحقیقات را میتوان در طبقه تحقیقات نیمه تجربی یا شبه تجربی قرار داد.
۱-۷-۲: جامعه و نمونه آماری تحقیق
سری زمانی داده های روزانه شاخص قیمت بورس اوراق بهادار تهران از سال ۱۳۸۴ لغایت ۱۳۸۹ به عنوان جامعه آماری تحقیق انتخاب گردیده است. داده های مزبور از سایت سازمان بورس و اوراق بهادار تهران استخراج گردیده است. همچنین متغیرهای مستقل استفاده در تحقیق که با توجه به مطالعات صورت گرفته در این زمینه به شرح زیر انتخاب گردید:
قیمت جهانی طلا (GP)، میانگین قیمت نفت ایران (OP)، نرخ دولتی دلار آمریکا (USD) و شاخص S&P500 بورس آمریکا به عنوان نماد بورس جهانی برای دوره مورد مطالعه انتخاب گردید.
۱-۷-۳: جنبه نوآوری تحقیق
تحقیقی با چنین محتوا و عنوانی تا به حال در ایران به انجام نرسیده است.
این تحقیق کمک می کند تا دریچه جدیدی از اطلاعات مورد نیاز، جهت رسیدن به اهداف اقتصادی که همان تخصیص بهینه منابع است، باز شود، تا عوامل درگیر و تصمیم گیران حول این مقوله با بکارگیری تکنیکهای کارا و مناسب و ترکیب دو تکنیک خطی و غیر خطی بتوانند تصمیمات خویش را با دقت و اطمینان بیشتری اخذ نمایند.
همچنین معرفی روشی جدید برای پیش بینی شاخص های بازارهای مالی برای اولین در مطالعات و پژوهش های کاربردی و دانشگاهی می باشد.
۱-۸: ساختار کلی تحقیق
در فصل اول کلیات تحقیق ارائه شد. تشریح و بیان موضوع تحقیق، ضرورت انجام و اهداف تحقیق، فرضیه-های تحقیق و روش آزمون فرضیات تحقیق در این فصل ارائه شد.
فصل دوم مبانی نظری و مروری بر پیشینه تحقیق را در بردارد. در این فصل پس از ارائه مفاهیم بنیادی موضوع تحقیق ، تحقیقات مختلفی که در رابطه با ابعاد مختلف موضوع تحقیق انجام گرفته مورد بررسی قرار گرفت.
فصل سوم روش تحقیق را مورد بحث قرار می دهد. در این فصل ابتدا فرضیه های تحقیق ، جامعه آماری، نمونه آماری و منابع اطلاعاتی تشریح گردیده است. سپس روش های آماده سازی متغیرهای تحقیق و روش های آزمون فرضیات مطرح شده است.
فصل چهارم به تجزیه و تحلیل اطلاعات و تحلیل یافته ها اختصاص دارد. در این فصل نتایج آزمون هر یک از فرضیه های تحقیق تشریح شده است.
فصل پنجم شامل خلاصه، نتیجه گیری و پیشنهادات می باشد . در این فصل ابتدا خلاصه موضوع، روشها و یافتههای تحقیق بیان شده، سپس نتیجه گیری و بررسی تطبیق یافته ها مورد بحث قرار گرفته است. در خاتمه پیشنهادها و زمینه های تحقیقاتی آتی ارائه شده است. فهرست منابع و مآخذ و پیوستهای تحقیق نیز ضمیمه است.
۱-۹: خلاصه فصل
درانجام هر پژوهشی یکی از مهمترین بخشها، ارائه طرح تحقیق (کلیات) مناسب می باشد. در این فصل سعی بر آن بود تا با بیان قسمتهای مختلف مطالعه انجام شده، طرح کلی از آن ارائه گردد. بدین منظور، در ابتدا با بیان مقدمهای کلیات طرح مشخص گردید و سپس به بیان مساله و چارچوب نظری، اهداف، دلایل اهمیت و ضرورت تحقیق پرداخته شده است. در ادامه فرضیه ها و روش تحقیق ارائه شده است. در انتها ساختار کلی تحقیق بیان شده است.
فصل دوم
مروری برمبانی نظری و
ادبیات تحقیق
۲-۱: مقدمه
بی تردید امروزه بیشترین مقدار سرمایه از طریق بازارهای بورس در جهان مبادله می شود. اقتصادهای ملی به شدت متاثر از عملکرد بازار بورس است. به علاوه بازار بورس به عنوان یک ابزار سرمایه گذاری در دسترس، هم برای سرمایه گذاران کلان و هم برای عموم مردم شده است. بازارهای بورس نه تنها از پارامترهای کلان، بلکه از هزاران عامل دیگر نیز متاثر می شوند. تعداد زیاد و ناشناخته بودن عوامل موثر بر بازار بورس، موجب عدم اطمینان در سرمایه گذاری شده است.
در حالت کلی آگاهی از ابهام و شرایط عدم اطمینان برای انسان مطلوبیت دارد و همواره در مورد دانستن اینکه در آینده چه روی خواهد داد، کنجکاو است. به همین جهت این امر برای افرادی که منابع هنگفت خود را سرمایه گذاری می کنند، اهمیت بیشتری دارد. سرمایه گذار مایل است با آگاهی از آیندهی شرکتِ سرمایه پذیر، اقدام به سرمایه گذاری در آن نماید و یا اینکه با اطلاع از وضعیت آتی قیمت آن، تصمیمات صحیح مبنی بر فروش، حفظ و یا گسترش سرمایه گذاری خود اتخاذ نماید. از این رو در این تحقیق به پیش بینی شاخص قیمت با بهره گرفتن از مدل ARIMAو MLP و تکنیک استخراج قانون و همچنین ترکیب روش های مزبور با بهره گرفتن از تبدیل موجک پرداختیم.
در این فصل ضمن بیان مقدمه ای از مفهوم و اهمیت بازار سهام، به تبیین و تشریح روش های مختلف پیش بینی ازجمله مدلARIMA ، شبکه های عصبی ، الگوریتم ژنتیک و تبدیل موجک به بیان تحقیقات صورت گرفته پیرامون پیش بینی قیمت سهام می پردازیم.
۲-۲: مبانی نظری پژوهش
۲-۲-۱: تئوری سرمایه گذاری در بازار بورس
تئوری سرمایه گذاری، پارامترهایی را که باید برای سرمایه گذاری در بازار مورد توجه قرار داده معرفی می نماید. از قدیم در بازار بورس همواره دو تئوری سرمایه گذاری وجود داشته است:
- تحلیل بنیادی[۴۱]
- خواب طلایی[۴۲]
با توجه به این دو تئوری می توان فهمید، که چگونه بازار شکل میگیرد؟ سرمایه گذار چگونه فکر و عمل می نماید؟ دنباله ای از این افکار و عکس العمل های سرمایه گذار محل سرمایه گذاری را معلوم و در نتیجه سطح بازار را مشخص می نماید. سرمایه گذاران برای رسیدن به منفعت، همواره در پی یافتن راههایی هستند که آینده بازار و سهام را معلوم کند. در فرایند سرمایه گذاری، سرمایه گذار با توجه به اطلاعات در دسترس، سهامی را انتخاب و در آن سرمایه گذاری می کند.(عباس پور،۱۳۸۱)
بر اساس تئوری اول، بازار عکس العمل بین سرمایه گذارها شکل می گیرد، این عکس العملها مبتنی بر اطلاعات واقعی شرکت های حاضر در بازار می باشند. اطلاعات واقعی شرکت بر اساس تجزیه و تحلیل وضعیت فعلی آن و چشم اندازهایی که دنبال می نماید، حاصل می شود و بازار بر اساس دیدگاه های منطقی شکل می گیرد.
بر اساس تئوری دوم، بازار حاصل رفتار سرمایه گذاران می باشد. سرمایه گذاران باید فقط به این مسئله توجه داشته باشند که امروز با قیمت ۲۰ واحد بخرند و فردا به قیمت ۳۰ واحد بفروشند. طبق این تئوری، اطلاعات واقعی مربوط به شرکت اصلا اهمیت ندارد و بازار حاصل تعامل روانی بین سرمایه گذاران می باشد.
۲-۲-۲: قابلیت پیش بینی و فرضیه بازار کارا
علیرغم وجود فرضیه بازار کارا، این فرضیه تنها مبتنی بر یک نظریه می باشد و هر نظریه با استنتاج ها و دلایل و مشاهدات مناسب قابل رد یا اثبات است. در واقع، ممکن است روش هایی ابداع شوند که خلاف این فرضیه را اثبات کنند. درک انسان بطور ذاتی محدود به میزان قابلیت پردازش اطلاعات دریافتی خود است، بنابراین کارایی او نیز محدود به میزان قدرت پردازش اطلاعاتی اوست. حال اگر بتوان روش های جدید پردازش را بوجود آورد که مانند روش های غیر خطی، دارای پتانسیل قوی استنتاج و کشف ساختارها و الگوها در سیستم های دینامیکی ناشناخته باشد در این صورت ممکن است فرضیه بازار کارا را زیر سوال برد.
البته این روش ها در مورد بازارهایی که همبستگی قیمت داشته و اصولا فرضیه بازار کارا در مورد آن ها صادق نباشد، نیز بخوبی عمل می کند و با آن می توان مدل هایی را ایجاد کرد، که بر اساس آن بتوان فرایند پیش بینی را با عملکرد نسبتا خوب(پیش بینی کوتاه مدت) انجام داد.
با توجه به مطالعات صورت گرفته در مورد کارایی بازار، هیچ مدرک روشنی بر غیر قابل پیش بینی بودن بازار وجود ندارد.
مساله کارایی، مقوله ای صرفا سیاه و سفید نیست. بازار نه کاملا کارایی دارد و نه یکسره از مفاهیم کارایی به کنار است. مساله مراتب امر و درجه کارایی است. سوال این است که بازار تا چه اندازه کاراست. یکی از معیارهای سنجش کارایی بازار سرمایه این است که بپرسیم چه نوع اطلاعاتی در قیمت اوراق بهادار منعکس است و تاثیر دارد.( خالوزاده،۱۳۸۲)
۲-۲-۳: شکل ضعیف[۴۳] نظریه بازار کارا
انعکاس اطلاعات بر قیمت سهام می تواند در سطحی نازل و به اصطلاح در شکل ضعیف آن مطرح باشد. در این سطح از کارایی، قیمت های اوراق بهادار فقط اطلاعاتی را که در گذشته قیمت ها نهفته است و از توالی تاریخی قیمت ها حاصل می شود، منعکس می کنند و این اطلاعات بلافاصله در قیمت های جاری منعکس می شوند در این حالت فرض می شود قیمت اوراق فقط منعکس کننده اطلاعات تاریخی است. پس شکل ضعیف کارایی بازار می گوید که با مطالعه روند تاریخی قیمت سهام، نمی توان روند آینده قیمت سهام را پیش بینی کرد و قیمت سهام روند خاصی ندارد و به عبارت دیگر بازار سهام حافظه ای ندارد، یعنی قیمت سهام در بازار کارا به شکل تصادفی تغییر می کند این همان نظریه گشت تصادفی یا گام های تصادفی[۴۴]است. اگر این نظریه صحت داشته باشد، آن دسته از سرمایه گذاران که بر اساس نمودار سهام را انتخاب می کنند، راه خطا می روند.
در شکل ضعیف فرضیه کارایی بازار، فرض بر این است که قیمت های سهام انعکاس دهنده ی آن اطلاعاتی است که در تاریخچه گذشته خود قیمت های سهام نهفته است، مثلا اگر الگویی فصلی در قیمت های سهام یافت شود، مثل کاهش قیمت های سهام نهفته است، مثلا اگر الگویی فصلی در قیمت های سهام یافت شود، مثل کاهش قیمت ها در آخرین روز معامله سال و آنگاه افزایش آن در اولین روز معامله سال جدید، بازار، این الگو را به سرعت شناسایی و با تعدیل قیمت، اثر این پدیده را خنثی می کند. با پیش بینی افزایش قیمت در روز اول سال جدید، کارگزاران خواهند کوشید که در همان لحظه های اولیه افتتاح بورس در سال نو، از این تفاوت استفاده کنند. تلاش آن ها برای خرید، باعث افزایش قیمت در همان دقایق نخستین می شود. کارگزاران با تجربه تر و با هوش تر فرا می گیرند که کار صحیح تر خرید سهام در آخرین روز پایانی سال قبل است، چرا که در این ساعت ها قیمت ها پایین تر است. تلاش آنان برای خرید در روز آخر باعث تقویت قیمت ها شده و دامنه کاهش قیمت در روز آخر را کاهش می دهد. این روند خرید زودتر، آن قدر ادامه می یابد تا اثری از بالا رفتن ها و پایین آمدن های بزرگ در نمودار قیمت ها باقی نماند. هر نوع الگوی مشابه و حتی پیچیده تری در طول زمان حذف می شود، تا آنجا که امکان هر نوع پیش بینی روند آینده از الگوی گذشته ناممکن شود، در این مرحله شکل ضعیف بازار کارا تحقق یافته است.
۲-۲-۴: شکل نیمه قوی[۴۵] نظریه بازار کارا
این سطح از نظریه نشان می دهد که قیمت سهام، منعکس کننده اطلاعات عام و منتشر شده است. در اینجا اطلاعات عام محدود به قیمت های گذشته نیست و در برگیرنده هر اطلاعی درباره عملکرد شرکت و مشخصات صنعتی است که شرکت در آن فعالیت می کند. بورس های معروف دنیا معمولا از شرکت ها می خواهند که اطلاعاتی درباره تمامی اوضاع شرکت را به اطلاع عموم برسانند. در بازار کارا در شکل نیمه قوی، قیمت بلافاصله با ورود اطلاعات جدید متاثر می شود. مثلا در بورس نیویورک، اگر قیمت سهام جنرال موتورx دلار باشد، این رقم با توجه به تمامی اطلاعاتی است که درباره این شرکت منتشر شده است و اگر اطلاعات تازه ای درباره این شرکت و یا صنعت و کل اقتصاد برسد، در یک بازار کارا، بلافاصله تعدیل قیمت صورت می گیرد. چنین کارایی، کمک بزرگی به سرمایه گذاران است به ویژه آنهایی که به امور مالی آشنایی ندارند. اگر تعدیل قیمت بلافاصله پس از رسیدن اخبار وقوع حوادث رخ ندهد(مثل بورس تهران) این امر نشانگر عدم کارایی بازار است.
۲-۲-۵: شکل قوی[۴۶] نظریه بازار کارا
در این حالت، فرض آن است که تمام اطلاعات مربوط و موجود، اعم از اطلاعات محرمانه[۴۷] و اطلاعات در دست عموم[۴۸] (جاری) در قیمت اوراق بهادار انعکاس دارد. قیمت اوراق بهادار حتی منعکس کننده تمام اطلاعات محرمانه جاری و تاریخی است، شکل قوی کارایی گسترده ترین مفهوم از کارایی است. در این شکل، اگر اتفاقی در شرکت بیفتد دیگر نمی شود گغت که فقط مدیر عامل آن را می داند و دیگران از آن بی اطلاعند. در این زمینه، قیمت سهام شرکت مورد نظر بلافاصله نسبت به این اتفاق عکس العمل نشان می دهد، چرا که دیگر اطلاعات محرمانه ای نباید موجود باشد در چنین وضعی، فرض بر این است که سیستمهای کنترل داخلی شرکت به قدری قوی است که کسی نمی تواند اطلاعات محرمانه و یا اطلاعات خاص، داشته باشد. وقتی مثلا مدیر عامل یا هیات مدیره از امری باخبر می شود بلافاصله بقیه نیز در جریان آن قرار می گیرد و چون همه خبر دارند، قیمت به سرعت متاثر می شودو بنابراین، اطلاعات به ظاهر محرمانه دیگر ارزش چندانی برای مدیر عامل و سایر مدیران عالی رتبه ندارد[۴۹]. شک نیست که این نوع کارایی فقط در کتاب ها یافت می شود و حتی در بورس های بسیار معتبر هم واقعیت نمی یابد، یعنی آنهایی که دسترسی دست اول به اطلاعات دارند، بازدهی سرمایه گذاریشان بیش از عامه مردم و سرمایه گذاران معمولی است. اگر بازار به شکل قوی کارا نباشد، کسی که سرمایه دارد و اطلاعاتش از بقیه بیشتر است و افراد خبره ای برای تحلیل این اطلاعات خاص در دسترس دارد، قاعدتا بازده بیشتری بدست می آورد. باید توجه داشت که دامنه این سوء استفاده ها در بورس های بزرگ چندان گسترده نیست. کسانی هم هستند که غیر از اشاره به شواهد تجربی، معتقدند که شکل قوی بازار کارای سرمایه عملی نیست، چون تمایز بین اطلاعات محرمانه و غیر محرمانه میسر نیست و به علاوه از شدت محرمانه بودن اطلاعات در طول زمان کاسته می شود. چه بسا موضوعی که امروز محرمانه است، فردا غیر محرمانه تلقی شود. بعلاوه، هنوز آزمون دقیقی که آشکارا بیانگر تاثیر اطلاعات محرمانه بر قیمت اوراق بهادار باشد، به آزمایش در نیامده است. یعنی بطور عملی روشن نشده است که چنین تاثیری وجود دارد.
هر چه از سطح ضعیف فرضیه به سمت سطح قوی آن پیشرفت حاصل شود، انواع مختلف تحلیل های سرمایه گذاری در تعیین مرز بین سرمایه گذاری های سودآور و غیر سودآور اثر خود را از دست می دهند و کم رنگ تر می شوند.
اگر شکل ضعیف معتبر باشد، تحلیل فنی[۵۰] یا تحلیل نموداری قیمت سهام بی اثر می شود. وقتی حرکت قیمت سهام از الگوی خاصی تبعیت می کند، استفاده کننده از نمودار (نمودارگر) نتیجه می گیرد که سهام در آینده جهت معینی خواهد داشت. در واقع، نمودارگر از فنون مختلف برای ارزیابی سری زمانی قیمت های قدیم سهام سود می جوید تا قیمت های آینده سهام را برآورد کند. اگر شکل ضعیف بازار کارا برقرار باشد، اطلاعاتی در قیمت های گذشته سهام وجود ندارد که برای پیش بینی آینده کارساز شود. هر اطلاعی که بوده توسط هزاران نمودارگر ماهر در مناطق مختلف تحلیل شده و به اتکای آن تحلیل ها، روی آنها خرید و فروش صورت گرفته است. از این رو، قیمت سهام به سطحی می رسد که در برگیرندهی همه اطلاعات مفید منعکس در قیمت های گذشته سهام است.
اگر شکل نیمه قوی بازار کارا مورد نظر باشد، تا زمانی که تحلیل ها به اطلاعات عام منتشر شده متکی است، با هیچ تحلیلی نمی توان بازدهی بهتر از بقیه بدست آورد مثلا تحلیل صورت های مالی شرکت، دیگر تحلیل کارساز نبوده و نمی تواند به تمایز بین سرمایه گذاری سودآور و غیر سودآور منجر شود. به عبارت دیگر از آنجایی که این صورت ها را قبلا هزاران تحلیل گر دیگر مورد بررسی قرار داده اند، آن تحلیل گران به اتکای آنچه یافته اند، عمل کرده اند و قیمت جاری سهام، اکنون بازتاب تمام اطلاعاتی است که در صورت های مالی یافت می شود. همین مساله در مورد سایر منابع اطلاعات عمومی منتشر شده صدق می کند.(عربی،۱۳۸۴)
۲-۲-۶: مطالعات صورت گرفته بر روی کارایی بازار
تاثیر بازار اوراق بهادار در توسعه اقتصادی یک کشور غیر قابل انکار است و وظیفه اصلی این بازار، به حرکت انداختن موثر سرمایه ها و تخصیص بهینه منابع می باشد؛ لذا در سالهای اخیر، تحقیقات تجربی بسیار زیادی در رابطه با تشخیص وضعیت بازار سرمایه صورت گرفته است. با بررسی تحقیقات انجام شده دریافت می شود؛ که با حضور چارتیست ها یا نمودارگراها و تحلیل گران ارزش ذاتی و ارائه نظراتشان، مساله کارایی بازار سرمایه، مورد توجه بسیاری قرار گرفته است. محققان با به کار گرفتن روش های همبستگی پیاپی، مقایسه تابع توزیع بازده سهام با توابع توزیع شناخته شده، قاعده فیلتر، آزمون گردش ها و آزمون های دیگر، سعی در آزمون کارایی بازار داشته اند و در دهه آخر بیستم با به کارگیری تکنیک های شبکه عصبی، همبستگی غیر خطی و آزمون های چند متغیره، آزمون های کارایی بازار وارد مرحله جدیدی گردید و اکثر مطالعات صورت گرفته در این دوران، عدم کارایی بازار اوراق بهادار را نشان می دهد.(خالوزاده،۱۳۷۷)
در ایران هم کارایی بازار بورس اوراق تهران مورد مطالعه قرار گرفته است و محققین با کاربرد روش های همبستگی پیاپی، آزمون های نرمالیته، قاعده فیلتر و آزمون گردش ها، عدم کارایی بازار را در سطح ضعیف نشان داده اند.
۲-۲-۷: مطالعات تجربی سطح ضعیف کارایی در بورس اوراق بهادار تهران
تحقیقات انجام شده در مورد کارایی ضعیف بازار بورس اوراق بهادار تهران، عدم کارایی این بازار را به اثبات رسانیده است. با وجود این روند، بازار بورس در آینده می تواند عدم کارایی بازار را دستخوش تحول قرار دهد.
در سال ۱۳۷۱ در ایران مطالعه ای جهت آزمون کارایی بازار در سطح ضعیف انجام شد. در این مطالعه ۱۷ شرکت در دوره ۱۳۷۰-۱۳۶۸ در نظر گرفته شدند. روش مورد استفاده در این تحقیق آزمون گردشها بوده است. این مطالعه در نهایت عدم کارایی بازار بورس اوراق بهادار را در سطح ضعیف نشان داده است.(نصرالهی,۱۳۷۱)
مطالعه دیگری با بهره گرفتن از روشهای خود همبستگی و آزمون گردش ها در مورد قیمت ۵۰ شرکت برای دوره ۱۳۷۲-۱۳۶۸ صورت گرفته است. نتیجه این تحقیق عدم کارایی بازاربورس تهران را در سطح ضعیف نشان داده است. (فدایی نژاد،۱۳۷۳و۱۳۷۴)
نمازی در سال ۱۳۷۴ تحقیقی در جهت آزمون کارایی بازار بورس در سطح ضعیف و با روش های ضریب همبستگی پیاپی آزمون های نرمالیته و قاعده فیلتر و روش فربد- نگهداری انجام داده است در این تحقیق داده های تحت بررسی قیمت روزانه و هفتگی ۴۰ شرکت در دوره ۱۳۷۳-۱۳۶۸ بوده است، نتیجه این تحقیقات عدم کارایی بازار بورس در سطح ضعیف است.(نمازی،۱۳۷۵)
۲-۲-۸: روش های پیش بینی
در ادبیات موضوع، روش های پیش بینی گوناگونی وجود دارد که رهیافت های گوناگونی از غیر رسمی ترین راه ها (مانند: مطالعه نمودار نوسانات بازار) تا رسمی ترین آنها (مانند:رگرسیون خطی یا غیر خطی) را شامل می شود. این تکنیک ها بر اساس نوع ابزار و نوع داده های مورد استفاده به چهار گروه طبقه بندی می شوند:
- روش های تحلیل فنی[۵۱]
- روش های تحلیل بنیادی[۵۲]
- روش های پیش بینی سری زمانی کلاسیک[۵۳]
- روش های هوشمند (یادگیری ماشینی)[۵۴]
نقطه مشترک این روشها، پیش بینی کردن و منفعت بردن از رفتار آیندهی بازار می باشد. هیچ یک از این روشها به عنوان روش صحیح و مسلط در دنیای سرمایه گذاری معرفی نشده اند. در ادامه در مورد هر یک از این روشها، ورودی ها و خروجی های آنها توضیح داده می شود. (عباس پور، ۱۳۸۱)
۲-۲-۸-۱: تحلیل فنی
آنالیز فنی روش پیش بینی زمان مناسب برای خرید و فروش یک سهم می باشد. این روش توسط افرادی که روند حاکم بر بازار را روندی روانی می دانند، دنبال می شود. از دیدگاه آنها قیمت سهام در بازار با توجه به عکس العمل سرمایه گذاران به نیروهای مختلف حرکت می کند. تحلیل گران فنی با بهره گرفتن از نمودارهای داده های فنی از قبیل: قیمت، حجم مبادله، پایین ترین و بالاترین حجم مبادله در هر پریود مبادله برای پیش بینی جهت حرکت سهام در آینده استفاده می نمایند. نمودارگرها از نمودار قیمت برای کشف روندهایی استفاده می کنند که بر اساس مسائل عرضه و تقاضا می باشند و اغلب دارای الگوهای سیکلی یا قابل توجه می باشند. از مطالعه این نمودارها قوانین تبادل استخراج شده و در بازار مورد استفاده قرار می گیرد. نمودارگرها معتقدند که بازار ۱۰% منطقی و ۹۰% روانی عمل می نماید. روش تحلیل فنی، یک روش عادی و عمومی برای پیش بینی بازار می باشد عیب عمده این روش، استخراج قوانین تبادل از نمودارها می باشد که به شدت وابسته به قضاوت ذهنی است و در نتیجه تحلیل گران مختلف می توانند قوانین تبادل مختلفی را از نمودارهای یکسان برداشت نمایند.
۲-۲-۸-۲: تحلیل بنیادی
تحلیل گرانی که از این روش استفاده می نمایند، از داده های بنیادی برای به دست آوردن تصویری شفاف از شرکتی که می خواهند در آن سرمایه گذاری نمایند، بهره می گیرند. هدف تحلیل گران بنیادی تعیین مقدار ذاتی داراییای است که در آن سرمایه گذاری می کنند. آنها این مقدار را بر اساس مطالعه متغیرهایی از قبیل رشد، سود تقسیمی سهام، نرخ بهره، ریسک سرمایه گذاری، سطح فروش، نرخ مالیات و غیره تعیین می نمایند و سپس از قانون مبادله زیر استفاده می نمایند:
اگر ارزش ذاتی دارایی بیشتر از ارزش بازاری آن باشد در آن سرمایه گذاری کن در غیر این صورت نه. در واقع تحلیل گران بنیادی معتقدند که بازار ۹۰% منطقی و ۱۰% روانی است.
تحلیل بنیادی به منظور پیش بینی بازار بر اساس افق بلند مدت می باشد زیرا داده هایی که به منظور تعیین مقدار ذاتی یک دارایی استفاده می شوند روزانه نیستند.
۲-۲-۸-۳: پیش بینی های سری زمانی کلاسیک
در روش های پیش بینی سری های زمانی کلاسیک، داده های تاریخی را تجزیه و تحلیل می نمایند و سعی می کنند مقادیر آینده یک سری زمانی را بر اساس ترکیب خطی از داده های تاریخی تقریب بزنند. دو نوع از پیش بینی سری های زمانی کلاسیک وجود دارد:
- رگرسیون یک متغیره
- رگرسیون چند متغیره
روش رگرسیون، عمومی ترین ابزار برای پیش بینی سری های زمانی در اقتصاد سنجی می باشد. برای استفاده از این روش ابتدا مجموعه ای از عواملی که سری تحت پیش بینی را متاثر می نمایند، تشکیل می شود. این عوامل به متغیر توضیحی معروفند. سپس یک نگاشت بین مقادیر و مقادیر سری زمانی صورت می گیرد.
روش های باکس جنکینز[۵۵] از مهم ترین و پراستفاده ترین روش های سری زمانی کلاسیک در جهت مدل کردن و تجزیه و تحلیل نمودن سری های زمانی می باشد. باکس و جنکینز سیستمی شامل یک یا چند ورودی و یک خروجی را برای تشریح روال سری زمانی پیشنهاد می کند. شکل زیر این سیستم فرضی را نشان می دهد:
ترکیب
شده
شکل ۲-۱: سیستم فرض مشتمل بر چند سری زمانی ورودی و یک سری زمانی خروجی
و … سری های زمانی هستند که فرض می شود بر یکدیگر اثر متقابلی ندارند و به نوعی در تغییرات سری زمانی خروجی سیستم موثرند. بنابراین از ترکیب مقادیر این سری در زمان های مختلف، میزان مقدار سری خروجی را در هر لحظه دلخواه t تخمین زد. ترکیب کننده ای هم در درون سیستم مفروض است که انتقال از مقادیر ورودی و خروجی را انجام می دهد که به آن تابع انتقال می گویند.
در صورتیکه عوامل موثر بر ایجاد سری زمانی خروجی را نشناسیم و یا اگر عوامل معلومند ولی داده های آنها موجود نباشد، برای مدل بندی سیستم، سری زمانی فرضی را که برایند همه عوامل موثر بر ساخت سری زمانی ورودی است جایگزین این عوامل می کنیم.
۲-۲-۸-۴: روش های هوشمند
این روشها از یادگیری استقرایی استفاده می کنند. همه این روشها از یک مجموعه داده برای ایجاد تقریب تابع مولد آنها بهره می گیرند. این روشها شامل سه گروه اصلی میباشند:
- روش های بر اساس شبکه های عصبی (NNs)
- روش های فازی
- روش های مبتنی بر محاسبات تکاملی
روش های مبتنی بر محاسبات تکاملی به سه گروه اصلی تقسیم می شوند که عبارتند از:
- الگوریتم های ژنتیک (GAs)
- برنامه ریزی تکاملی (EP)
- برنامه ریزی ژنتیک (GP)
لازم به ذکر است که از برنامه ریزی ژنتیک، شبکه های عصبی و برنامه ریزی تکاملی برای ساخت مدل های پیش بینی غیر خطی استفاده می کنند؛ در حالی که الگوریتم ژنتیک را برای میزان کردن پارامترهای بعضی مدل های پیش بینی خطی، غیر خطی و آماری بکار می برند.(واگنر[۵۶] و همکاران،۲۰۰۶)
۲-۲-۸-۵:جمع بندی روشهای پیش بینی
همانطور که قبلا تعریف شد؛ سری زمانی مجموعه ای از مشاهدات است که بر حسب زمان مرتب شده اند(فاطمی،۱۳۷۵) و پیش بینی بارزترین مورد استفاده از سریهای زمانی میباشد، بطوریکه در صنعت و اقتصاد از اهمیت زیادی برخوردار است.
در مدلهای علی و معلولی از رابطه بین سری زمانی مورد نظر و یک یا چند سری زمانی دیگر بهره میجویند. اگر این متغیرهای اخیر با متغیر مورد نظر دارای همبستگی باشند و برای این همبستگی ظاهرا علتی وجود داشته باشد، می توان یک مدل آماری که توصیف کننده این رابطه باشد، بنا کرد سپس با دانستن مقادیر متغیرهایی که به یکدیگر همبسته شده اند، می توان از مدل استفاده تا متغیر غیر مستقل را پیش بینی کرد. یک محدودیت آشکار برای استفاده از مدلهای علت و معلولی نیاز به این امر است که متغیرهای مستقل در زمانی که پیش بینی به عمل می آید معلوم باشند. یکی از مناسبترین روشهای سری زمانی استفاده شده مدل ARIMA میباشد، در حال حاضر در این مدل روش مناسبی وجود ندارد که به محض اینکه مشاهده جدیدی در دسترس قرار گرفت، تخمین پارامترهای مدل را اصلاح یا به روز نماید و پژوهشگر ناگزیر است بطور کامل مدل را برازش نماید. و همچنین ما باید فرض نماییم که تکامل آینده سری زمانی با گذشته یکسان خواهد بود، یعنی شکل مدل با زمان تغییر نخواهد نمود. عدم امتیاز نهایی مدلهای ARIMA سرمایه گذاری مورد نیاز در زمان یا سایر منابع برای ساختن یک مدل رضایت بخش است، ولی این مدلها بخصوص برای سریهای زمانی ای که در فاصلهی نمونه گیری خیلی کوچکند، بدیل اینکه تاریخ نسبتا طولانی یی را به آسانی میتوان تهیه کرد به نحو شایستهای مناسبند.(فاطمی،۱۳۷۵)
شبکه های عصبی مصنوعی در واقع یک سیستم داده ÷ردازی اطلاعات هستند و دارای خصوصیات اجرایی خاص مانند شبکه های عصبی جانوری است. همچنین این روشها از جمله مدلهای تابع انتقال بوده که کاربرد وسیعی پیدا کرده اند، این مدلها بطور طبیعی از زمینههایی ناشی میشوند که یک ساختار همبسته کننده یا ساختار علی بین متغیرهایی که بطور موقت یا بطور مداوم با هم مرتبط بوده اند، وجود دارد. مدلهای تابع انتقال فرض می کنند که ورودی متغیر را تحت تاثیر قرار می دهند؛ اما این رابطه تک سویی است، یعنی روی تاثیری ندارد. این موضوع می تواند در عمل غیر واقعی باشد.(مصطفی کیا،۱۳۸۸)
روشهای تحلیل رگرسیون اماری غیر خطی شبیه شبکه های عصبی است. تجربه های زیادی موجب شده است که روشهای نگاشت توسط شبکه های عصبی با بهترین روشهای رگرسیون غیر خطی قابل مقایسه باشند. روشهای شبکه عصبی نسبت به روشهای رگرسیون خطی برای فضاهایی با ابعاد بالا ارجحیت دارد.
مهمترین امتیاز شبکه های عصبی جهت نگاشت نسبت به روشهای رگرسیون آماری کلاسیک این است که شبکه های عصبی شکل تابعی عمومی تری را نسبت به روشهای آماری کلاسیک دارند بعنوان مثال در تحلیلهای فوریه نمونههای یادگیری به شکل امواج سینوسی و بصورت مضاربی صحیحی از فرکانس، برای محاسبه یک تابع بکار میروند. در محاسبات عصبی شبکه های عصبی نمونههای یادگیری را جهت تنظیم دقیق دامنه، فاز و فرکانس بکار میبرد و موجب افزایش چشمگیر دقت تابع می شود. شبکه های عصبی از جمع آثار خطی پیروی نکرده و همچنین انحصارا از توابع متعامد استفاده نمی کنند. در تحلیل های رگرسیونی آماری توابع خطی برازشی می توانند توابعی غیر خطی از اطلاعات ورودی باشند ولی تنها از توابع خطی نسبت به پارامترها استفاده میگردد. در رگرسیون آماری غیر خطی توابع برازش می توانند هم نسبت به اطلاعات ورودی و هم نسبت به پارامترها غیر خطی باشد.(خالوزاده،۱۳۷۷)
شبکه های عصبی مصنوعی اصلا می تواند بعنوان یک روش رگرسیون غیر خطی بکار رود. تفاوت اساسی دیگر بین شبکه های عصبی و رگرسیون در این است که معمولا در تحلیلهای آماری ساختار داخلی شبکه های عصبی ناشناخته باقی میماند، یعنی ساختار داخلی آن نامعلوم باقی میماند و مانند یک جعبه سیاه ممتد عمل می کند، ولی نتایج آن در بسیاری از موارد مفید میباشد. ساختارهای شبکه های عصبی معمولا موقتی است وای راهنمائیهایی برای برازش با یک مدل آماری می تواند ارائه نمایند.(هاپتوف[۵۷]،۱۹۹۳ و تانگ[۵۸]،۱۹۹۱)
لذا بسیاری از شبکه های عصبی از نظر عملکرد معادل رویههای استاندارد آماری هستند به عنوان مثال شبکه های پروسپترون تعمیمی از مدلهای خطی هستند.(مصطفی کیا،۱۳۸۸)
۲-۲-۹: شاخص قیمت سهام
شاخص بهای سهام در اقتصاد هر کشوری یکی از اساسی ترین متغیر های کلان اقتصادی است؛ به گونه ای که رشد متعادل و مداوم این شاخص به معنای رشد و رونق اقتصادی کشور استدو برعکس، کاهش مداوم آن نشان از رکود اقتصاد دارد و تغییرات انفجاری و پیوسته آن (در جهت بالا و پایین) گویای بی ثباتی شرایط اقتصادی جامعه است.
همانگونه که در هنگام خرید کالا نخستین پرسش از مغازه دار بهای کالاست، سرمایه گذار نیز هنگام خرید سهام، به یکی از نخستین نکاتی که توجه دارد، تغییرات بهای سهام است.
هر سرمایه گذاری در هنگام خرید سهام مهمترین مسئله ای را که در نظر می گیرد، تغییرات قیمت آن سهام می باشد. لذا لازم است که از نماینده ای جامع از عملکرد بازار به عنوان شاخص قیمت استفاده نماید. تغییرات قیمت هر سهم می تواند ناشی از دو عامل باشد، یکی شرایط ویژه ایست که بر قیمت آن سهم بخصوص تاثیر می گذارد، مثلا مدیریت بهینه و کارا در سازمان، افزایش سرمایه و سودآوری و … و دیگری عوامل تاثیر گذار بر کل بازار سهام می باشد، که این عامل به عنوان ریسک بازار شناخته می شود، تغییرات مداوم و ناهمگون شاخص نماینگر افزایش ریسک در بازار می باشد و می دانیم که سرمایه گذاران ترجیح می دهند در یک بازار آرام و مطمئن که سیر مشخصی دارد سرمایه گذاری کنند، زیرا عموما سرمایه گذاران ریسک گریز هستند و افزایش ریسک در بازار سرمایه موجب کاهش سرمایه گذاری در آن می شود.
ارزیابی یک سبد فرضی از کل سهام یک بازار مالی کار بسیار دشواری است، لذا نماینده ای به عنوان شاخص جهت آشکار سازی روند حرکت بازار، در اختیار سرمایه گذاران گذاشته شده است تا بتوانند با کمک آن در خرید سهام تصمیمات بهتری اتخاذ نمایند.
۲-۲-۱۰: تعریف شاخص
شاخص از لحاظ لغوی به معنای نماینده، نشان دهنده و نمودار می باشد، و وسیله ایست جهت تشخیص و یا تمایز بین دو متغیر، اما از لحاظ آماری کمیتی است که به صورت نسبی تغییرات را در گروه های مختلف بیان می کند.
شاخص بطور کاربردی به عنوان نماینده ای از بین کمیت های همگن می باشد و می تواند میزان و جهت تغییر این کمیت ها را بطور نسبی اندازه گیری کند، شاخص بر حسب مقدار آن در یک زمان پایه سنجیده می شود که این مقدار پایه را عموما ۱۰۰ فرض می کنند، بنابراین بر مبنای شاخص می توان تغییرات ایجاد شده در متغیرهای معینی را در یک دوره بررسی نمود.
۲-۲-۱۱: فواید شاخص
در یک نظام اقتصادی کارا می بایست اطلاعات مفید و هر چند مختصر و قابل اعتماد از کل حرکت بازار در اختیار سرمایه گذاران قرار بگیرد. از روی اعداد شاخص تغییرات احتمالی در آینده را می توان پیش بینی کرد.
شاخص ها ابزاری برای مقایسه کردن تغییرات یک پدیده در دو زمان متفاوت هستند و می توان تغییرات گروهی چند پدیده را با هم مقایسه نمود. با شاخص، قیمت های صنایع مختلف را با یکدیگر مقایسه کرد.
هر شاخصی محتوای اطلاعاتی از حوزه های مختلف و وسیع می باشد و لذا می تواند بازتاب خوبی از شرایط اقتصادی آن حوزه باشد و می توان از آن به عنوان نمادی برای پیش بینی عملکرد فعالیت های اقتصادی در آینده استفاده نمود.
۲-۲-۱۲: شاخص قیمت بورس تهران
شاخص قیمت سهام در بورس تهران از سال ۱۳۶۹ محاسبه شد و با نام اختصاری TEPIX که معرف TEhran Price IndeX میباشد، که از همان سال در سطح بین المللی شناخته شد. این شاخص در آن زمان شامل ۵۲ شرکت بود که کل تعداد شرکت های پذیرفته شده در بورس در آن زمان بود.
این شاخص در واقع با بهره گرفتن از فرمول لاسپیز محاسبه می گردد و فرمول آن به این صورت می باشد که بر اساس ارزش جاری سهام منتشره محاسبه می شود و بر این اساس روند تغییرات ارزش جاری سهام را نشان می دهد:
(۲-۱) * Base Value Tepix =
که در آن:
t زمان محاسبه شاخص
قیمت سهام i ام در زمانt
قیمت سهام i ام در زمان پایه
تعداد سهام منتشره شرکت i ام در زمان t
تعداد سهام منتشره شرکت i ام در زمان پایه
Base Value عدد مبنا که مقدار آن ۱۰۰ می باشد.
به عبارت دیگر فرمول محاسبه شاخص قیمت تپیکس بصورت زیر می باشد:
(۲-۲) ۱۰۰ * TEPIX =
تاریخ مبنا اول فروردین ۱۳۶۹ در نظر گرفته شده است. همانطور که مشاهده می کنیم صورت کسر همان ارزش بازار در زمان جاری می باشد. این نکته را باید در نظر داشته باشیم که در زمان یعنی تاریخ مبنا عملا می باشد و در زمان پایه با بهره گرفتن از فرمول لاسپیرز به محاسبه شاخص می پردازیم، ولی با مرور زمان بر اثر تغییراتی نظیر افزایش سرمایه از محل اندوخته ها و یا تقسیم شدن یک سهام بزرگ به یک یا چند سهام کوچکتر و یا بالعکس که تعداد سهام را تغییر می دهند ولی عملا نباید در شاخص تغییری رخ دهد و به این علت ها ممکن است که مقدار کسر تغییر یابد و در واقع به گونه ای در آن تعدیل ایجاد می کنند تا در اثر عواملی مثل عوامل ذکر شده در بالا شاخص تغییر نکند.
۲-۲-۱۳: ویژگی های TEPIX
۱- جامعیت
از ویژگیهای بسیار بارز و ارزشمند این شاخص قیمت، جامعیت آن می باشد، زیرا این شاخص بر اساس تمامی سهام های پذیرفته شده در بورس اوراق بهادار تهران می باشد و بنابراین می تواند نماینده خوبی از وضعیت بازار بورس تهران باشد و در حد خوبی می تواند حرکت بازار را نشان دهد.
۲- موزون بودن
دومین ویژگی مهم این شاخص موزون بودن آن میباشد. همانطور که در محاسبه این شاخص دیده شد، در این فرمول وزن دهی بر اساس مقدار هر سهام می باشد، یعنی سهامی دارای تاثیر بیشتری در اندازه شاخص دارد که اندازه ارزش بازار آن سهام یعنی حاصلضرب تعداد آن سهام در قیمت آن سهام، بیشتر باشد.
۳- در دسترس بودن
سومین مشخصه این شاخص در دسترس بودن آن است، زیرا با گسترش نر افزار های موجود در بازار سرمایه و به روزرسانی آنها امکان محاسبه لحظه ای این شاخص میسر شده است و در معرض دید قرار میگیرد.
۲-۲-۱۴: شاخص های فرعی در بورس اوراق بهادار تهران
تا اینجا شاخص کل بازار بورس را تحت عنوان TEPIX را معرفی کردیم، همانطور که گفته شد این شاخص همه شرکت های پذیرفته شده در بورس را در برمی گیرد، به همین دلیل این شاخص بسیار جامع می باشد و می تواند نماینده خوبی از وضعیت موجود بازار باشد، این شاخص می تواند به اقتصاددان ها در تحلیل اوضاع موجود اقتصادی کشور و بررسی آن کمک کند و در کل می تواند در اکثریت مواقع جهت گیری بازار را نشان دهد.
ولی با یک شاخص کلی مثل TEPIX امکان بررسی و تحلیل و ارزیابی بخش های مختلف بازار وجود ندارد، یعنی ما با این شاخص نمی توانیم به بررسی بخش های جزئیتری و کوچک تر بازار بپردازیم، از اینرو شاخص های اختصاصی و جزئیتری ایجاد شده است که کمک می کند تا سرمایه گذاران بتوانند در بخشهایی که مایلند سرمایه گذاری کنند با اطلاعات دقیقتری در آن بخش سرمایه گذاری کنند. این شاخص ها عبارتند از:
۲-۲-۱۴-۱: شاخص صنایع
این شاخص دربرگیرنده شرکت های صنعتی است و از نظر محاسبه همانندTEPIX محاسبه می شود، فقط تعداد شرکت های آن محدود شده است. سرمایه گذارانی که میخواهند در شرکت های صنعتی سرمایه گذاری کنند، بهتر است که با توجه به شاخص های این گروه به تصمیم گیری بپردازند.
۲-۲-۱۴-۲: شاخص شرکت
شاخص شرکت به تفکیک برای هر شرکت پذیرفته شده محاسبه و مبنای محاسباتی همانند روشی است که در محاسبه شاخص صنایع و کل بکار می رود، شاخص شرکتهای جدید در بدو پذیرش ۱۰۰ تعیین شده تا امکان بررسی تغییرات آنها فراهم باشد.
۲-۲-۱۴-۳: شاخص ۵۰ شرکت با بیشترین ارزش
سازمان بورس اوراق بهادار تهران هر سه ماه یکبار ۵۰ شرکت با بیشترین ارزش جاری را انتخاب کرده، این شرکت ها سهم بیشتر بازار را در اختیار دارند و در واقع از مزایای این شاخص این است که اثرات منفی شرکت های کوچک در شاخص جلوگیری می کند.
در پایان هر سه ماه این شرکت ها مورد بررسی قرار گرفته و در صورت لزوم از این لیست حذف و شرکت های جدید به آن اضافه می شود.
۲-۳: پیشینه تحقیق
مطالعات صورت گرفته را می توان به دو دسته تقسیم کرد: دسته نخست مطالعاتی که در زمینه کارایی یا عدم عدم کارایی بازار بورس صورت گرفته، دسته دوم مطالعاتی که به مقایسه روش های هوشمند با روش های کلاسیک می پردازند. تقریبا تمامی مطالعات انجام شده در زمینه کارایی بازار حاکی از عملکرد بهتر روش های هوشمند نسبت به روش های خطی می باشند. در این بخش به بررسی مطالعات داخلی و خارجی صورت گرفته در زمینه پیش بینی قیمت سهام می پردازیم.
۲-۳-۱: مطالعات داخلی
حسن زاده (۱۳۸۸) در پایان نامه کارشناسی ارشد خود برای پیش بینی قیمت سهام شرکت های شهد ایران، چادرملو، سایپا، اقتصاد نوین و پتروشیمی آبادان از برنامه ریزی ژنتیک استفاده نمود. ابتدا با بهره گرفتن از آماره η متریک پیش بینی پذیری هر یک از شرکت های مزبور محاسبه شد و سپس با بهره گرفتن از برنامه ریزی ژنتیک مدل سازی پیش بینی قیمت صورت پذیرفت. نتایج با نتایج بدست آمده از مدل FARIMA-FIGARCH مقایسه گردید. نتایج تحقیق بیانگر کمتر بودن میانگین خطای پیش بینی مدل FARIMA-FIGARCH از مدل برنامه ریزی ژنتیک بود.
آذر و افسر (۱۳۸۵) در تحقیق خود مدل شبکه های عصبی فازی پیش بینی قیمت سهام را طراحی کرده و از لحاظ شش معیار ارزیابی عملکرد با روش ARIMA مقایسه نمودند. نتایج این تحقیق بیانگر این حقیقت است که شبکه های عصبی فازی در تمامی شش معیار ارزیابی عملکرد بر روش ARIMA برتری داشته است و دارای ویژگیهای منحصر به فرد همگرایی سریع، دقت بالا و توانایی تقریب تابع قوی هستند و برای پیش بینی شاخص قیمت سهام مناسب می باشند.
ابوئی مهریزی (۱۳۸۵) پیش بینی قیمت سهام را با بهره گرفتن از شبکه های عصبی-فازی (ANFIS) انجام داده است. در پیش بینی بلند مدت پس از انجام محاسبات ۱۸ مدل به دست آمد که از بین آنها مدل TRIMF به عنوان مدل بهینه انتخاب شد. در مدل پیش بینی کوتاه مدت برای هر دوره ۶ مدل طراحی شد که با توجه به سطح خطا مدل TRIMF برای سه ماههی اول، مدل TRAPMFبرای سه ماههی دوم، مدل GAUSSZMF برای سه ماههی سوم و مدل TRAPMFبرای سه ماههی چهارم به عنوان مدل بهینه انتخاب شدند.
عطری نژاد (۱۳۸۵) در پایان نامه کارشناسی ارشد خود پیش بینی روند تغییرات در بازار بورس را با بهره گرفتن از سری زمانی گارچ انجام داده است. نتایج این مدل بر روی پنج سهم کالسیمین، ملی سرب و روی ایران، نیرو ترانس، معدنی املاح ایران و آهنگری تراکتورسازی مورد بحث قرار گرفته است.
مهدوی و بهمنش(۱۳۸۴) در تحقیق خود از شبکه های عصبی مصنوعی برای پیش بینی قیمت سهام شرکت سرمایه گذاری البرز استفاده نمودند. نتیجه حاصل از مدل طراحی شده نشان می دهد که اگر یک شبکه عصبی مصنوعی درست آموزش ببیند می تواند روابط بین متغیرها را (هر چند پیچیده و غیرخطی) شناسایی کرده و در پیش بینی قیمت سهام شرکتهای سرمایه گذاری با حداقل خطا (در این تحقیق۰۴۴/۰) موثر واقع شود.
طالبی (۱۳۸۴) در پایان نامه کارشناسی ارشد خود قیمت سهام ۱۰ روز آینده ۴۰ شرکت فعال در بورس اوراق بهادار تهران را با بهره گرفتن از ۳ روش شبکه عصبی پیشخور تک لایه با الگوریتم یادگیری لونبرگ-مارکوات و معیار عملکرد میانگین مربعات خطا با ورودی ارزش بازار، شبکه عصبی با اضافه کردن میانگین های متحرک ۵، ۱۰، ۲۰روزه و ROC و RSI 12 روزه و مدل ARMA پیش بینی نمود. نتایج بدست آمده نشان داده است که مدل خطی ARMA بهتر از مدلهای غیر خطی شبکه های عصبی توانسته اند پیچیدگیهای سری های زمانی قیمت سهام را تجزیه و تحلیل نموده و برای پیش بینی قیمت سهام مورد استفاده قرار گیرد.
عربی (۱۳۸۴) در مطالعه خود به مقایسه روش شبکه عصبی با روش ARIMA در پیش بینی قیمت سهام شرکت سرمایه گذاری صنایع پتروشیمی پرداخته است. نتایج حاصل از ANN و ARIMA حاکی از برتری عملکرد شبکه عصبی مصنوعی نسبت به ARIMA می باشد.
زارع (۱۳۸۴) در مطالعه ای رفتار شاخص قیمت سهام را در ایران مورد بررسی قرار داده است. وی با بهره گرفتن از یک الگوی خود همبسته با وقفه توزیعی (ARDL) و بهره گیری از مدل تعالی قیمت گذاری دارایی های سرمایه ای (CAPM) سعی در شناخت و تبیین تاثیر برخی از متغیرهای تاثیرگذاری بر شاخص قیمت سهام بازار بورستهران طی دوره فصل سوم سال ۱۳۷۲ تا فصل اول سال ۱۳۸۲ دارد. نتایج الگوی کوتاه مدت نشان می دهد که متغیرهای وقفه اول لگاریتم شاخص قیمت سهام، لگاریتم نسبت شاخص قیمت داخلی به خارجی، لگاریتم قیمت نفت و لگاریتم بهای سکه دارای تاثیر مثبت و ورودی لگاریتم نرخ ارز و لگاریتم حجم پول دارای تاثیر منفی و معنی داری بر روی متغیر لگاریتم شاخص قیمت سهام می باشد. نتیجه برآورد الگوی بلند مدت نشان می دهد که متغیرهای لگاریتم نسبت شاخص قیمت داخلی به خارجی، لگاریتم شاخص قیمت مسکن، لگاریتم قیمت نفت و لگاریتم بهای سکه دارای رابطه مستقیم و دو متغیر لگاریتم نرخ ارز و لگاریتم حجم پول دارای رابطه عکس و معنی داری با متغیر لگاریتم شاخص قیمت سهام می باشند.
هادی پور (۱۳۸۲) مطالعه ای جهت تعیین بهترین مدل پیش بینی قیمت سهام در گروه صنایع غذایی و آشامیدنی بورس اوراق بهادار تهران انجام داده است. در این تحقیق پیش بینی با بهره گرفتن از روش های سری زمانی تخمین روند، هموارسازی نمایی و میانگین متحرک و باکس-جنکینز برای ۴ هفته انتهایی سال ۷۹ انجام شده است و سپس شاخص MSE روش های مختلف با یکدیگر مقایسه شده است. این تحقیق به این نکته اصرار می ورزد که مدل مشخصی برای پیش بینی قیمت سهام در گروه صنایع غذایی و آشامیدنی وجود ندارد و برای پیش بینی قیمت سهام هر شرکت ابتدا باید با بهره گرفتن از روند و خصوصیات آن سری زمانی داده ها، مدل مناسب را با بهره گرفتن از روش شناسی مدلهای پیش بینی انتخاب و سپس با بهره گرفتن از آن مدل به پیش بینی قیمت سهام آن شرکت اقدام نمود.
عباسپور (۱۳۸۱) مطالعه ای جهت پیش بینی قیمت سهام شرکت ایران خودرو در بازار بورس تهران با بهره گرفتن از شبکه عصبی مصنوعی انجام داده است. دادههایی که در این مطالعه مورد استفاده قرار گرفته به صورت روزانه بوده و دوره زمانی ۸۰-۱۳۷۹ را شامل می شود. متغیرهای موثر بر قیمت سهام شرکت ایران خودرو شامل نرخ ارز، قیمت نفت، نسبت P/E و حجم مبادلات سهام می باشد. نتایج این تحقیق نشان از برتری نتایج حاصل از پیش بینی قیمت توسط شبکه عصبی مصنوعی نسبت به روش باکس – جنکنیز می باشد.
چاوشی(۱۳۸۰) در مطالعه خود به پیش بینی پذیری رفتار قیمت سهام در بورس اوراق بهادار تهران توسط مدل چند شاخصی آربیتراژ و شبکه های عصبی مصنوعی پرداخته است. جهت آزمون این مساله، قیمت روزانه سهام شرکت صنایع بهشهر به عنوان نمونه آماری انتخاب شده است. نتایج حاکی از موفقیت این دو مدل در پیش بینی رفتار قیمت سهام مورد نظر و همچنین برتری عملکرد شبکه های عصبی مصنوعی بر مدل چند شاخصی آربیتراژ بوده است.
صفر نواده (۱۳۸۰) در مطالعه خود به امکان سنجی پیش بینی قیمت سهام در بازار بورس اوراق بهادار تهران پرداخته است. وی این کار را از طریق بررسی چند متغیر مهم و تاثیر گذار که عبارتند از:
- نسبت سود تقسیم شده به قیمت سهم ()
- نسبت ()
- حجم مبادلات (V)
- ریسک ®
- تفاوت پایین ترین قیمت سهم با قیمت روز بخش بر قیمت روز سهم ()
و با بهره گرفتن از روشهای پیش بینی آماری رگرسیون و ARIMA انجام داده است.
بت شکن (۱۳۷۹) در پایان نامه خود از یکی از تکنیکهای هوش مصنوعی بنام شبکه های عصبیفازی ANFIS استفاده نموده و توانایی این مدل را در پیش بینی قیمت سهام در مقایسه با مدل های خطی ARIMA مورد سنجش قرار داده است. در شبیه سازی انجام شده انواعی از شبکه های ۲ ورودی تا ۵ ورودی با تعداد توابع عضویت متفاوت و نگاشتهای مختلف جهت پیش بینی سری زمانی قیمت سهام شرکت گروه بهمن مورد استفاده قرار گرفته اند. برای تعیین مدل ARIMA نیز متدولوژی باکس-جنکینز استفاده گردیده است. نتایج بررسی نشان دهنده برتری و اولویت شبکه ANFIS در پیش بینی قیمت سهام نسبت به مدل ARIMA می باشد.
عزیزخانی (۱۳۷۹) در مطالعه خود از روش های ترکیبی برای پیش بینی قیمت سهام استفاده کرده است. در انجام این تحقیق دو شرکت به عنوان انتخاب شده و سپس با بهره گرفتن از روش های پیش بینی فردی قیمت سهام برای چند دوره مورد نظر برآورد شده است و نتایج حاصل از پیش بینیهای فردی با روش های مختلف ترکیب شده است. مدل ترکیبی از نظر کاهش میزان خطا با سایر مدل های مقایسه شده و در نهایت مدل بهینه معرفی شده است.
تیموری (۱۳۷۸) در پایان نامه کارشناسی ارشد خود تحت عنوان “کاربرد شبکه های عصبی در پیش بینی شاخص صنعت تحت تاثیر متغیرهای کلان اقتصادی” به مقایسه روش های پیش بینی خطی و عصبی پرداخته که در آن داده ها بصورت هفتگی میباشد. شبکه مورد استفاده دارای سه لایه است که لایه میانی شامل پنج گره بوده و توابع انتقال آن از نوع هلالی می باشند، نتایج این تحقیق نشان از برتری محسوس شبکه عصبی بر رگرسیون خطی دارد.
خالوزاده (۱۳۷۷) در رساله دکتری خود با بهره گرفتن از اطلاعات روزانه سری زمانی قیمت و بازده سهام شرکت شهد ایران به پیش بینی قیمت سهام و نیز ارائه مدل بهینه پرداخته است. روش های پیش بینی مورد استفاده در این تحقیق، شامل روش های پیش بینی بر اساس مدل های خطی و غیر خطی (شبکه های عصبی) میباشد و با توجه به نتایج بدست آمده نشان داده شده است که قیمت سهام از نگاشتهای پیچیده غیر خطی به وجود آمده اند و استفاده از انواع روش های خطی صحیح نمی باشد.
رجب زاده قطرمی (۱۳۷۷) در مطالعه خود به بررسی روش های پیش بینی و ترکیب این روشها با هدف کاهش خطای پیش بینی پرداخته است. نتایج بدست آمده حاکی از کاهش بسیار زیاد خطای پیش بینی روش های ترکیبی نسبت به روش های فردی می باشد.
۲-۳-۲: مطالعات خارجی
تانگ و همکارانش[۵۹](۲۰۱۰) با بهره گرفتن از ترکیب تبدیل موجک[۶۰] ، شبکه عصبی پیشخور[۶۱] و الگوریتم مورچگان[۶۲] مدلی برای پیش بینی قیمت سهام ارائه نمودند. ایشان در ابتدا با بهره گرفتن از موجک هار[۶۳] اقدام به تجزیهی سری زمانی قیمت نمودند سپس با بهره گرفتن از شبکه عصبی پیشخور پیش بینی صورت گرفت و وزنهای حاصل از شبکه عصبی با بهره گرفتن از الگورتم مورچگان بهینه گردید. مدل ارائه شده بر روی داده های میانگین شاخص صنعت داو جونز[۶۴] (DJIA)، شاخص FTSE-100 بورس لندن (FTSE)، شاخص NiKei-225 بورس توکیو (Nikkei) و شاخص بورس تایوان (TAIEX) مورد آزمون قرار گرفت. مدل مزبور با مدل ترکیبی شبکه عصبی و الگوریتم مورچگان، مدل سری زمانی فازی[۶۵] و شبکه عصبی فازی(ANFIS) مقایسه گردید. در تمامی موارد آزمون شده مدل پیشنهادی نسبت به بقیه مدل ها از خطای کمتری برخوردار بود.
هداوندی و همکارانش[۶۶] (۲۰۱۰) با بهره گرفتن از ترکیب شبکه عصبی و ژنتیک فازی[۶۷] مدلی برای پیش بینی قیمت سهام ارائه نمودند. ایشان مدل مزبور را بر روی داده های جمع آوری شده برای صنعت IT و هواپیمایی بورس نیوریوک آزمون نمودند. مدل پیشنهادی با مدلهای ARIMA و الگوریتم ژنتیک و شبکه عصبی استفاده شده در پیش بینی مورد مقایسه قرار گرفت که در تمامی موارد مدل پیشنهادی بر مدلهای قبلی نتایج بهتری بدست داد.
آلوارز دیاز و میگز[۶۸] (۲۰۰۸) از برنامه ریزی ژنتیک برای بررسی کیفیت بنگاهها استفاده نمودند. آن ها از یک GP برای بررسی رابطه بین کیفیت بنگاهها و مجموعه ای از متغیرهای تاریخی، اقتصادی، جغرافیایی، مذهبی و اجتماعی استفاده نمودند. نتایج بدست آمده حاکی از این موضوع است که GP می تواند نتایجی به دقیقی OLS را ارائه دهد.
چن و همکارانش[۶۹] در سال ۲۰۰۸ از یک مدل سری زمانی فازی برای پیش بینی کوتاه مدت قیمت سهام تایوان و هنگ کنگ استفاده نمودند. نتایج تجربی بدست آمده از این تحقیق بیانگر این است که روش آماری سنتی و مدل ارائه شده هر دو مشخص می کنند که الگوهای قیمت سهام در این دو بازار کوتاه مدت هستند.
از آنجایی که در بازار سهام، سرمایه گذاران عقلایی پیش بینی هایشان را بر اساس جدید ترین خطاهای پیش بینی اصلاح می کنند، چنگ و همکارانش[۷۰] در سال ۲۰۰۸ از یک مدل جدید سری زمانی فازی برای کاهش خطای پیش بینی در بازار سهام تایوان استفاده نمودند. نتایج حاکی از برتری این مدل نسبت به مدل چن و یو[۷۱] بوده است.
چانگ و لو[۷۲] در سال ۲۰۰۸ از قاعده فازی نوع [۷۳]TSK برای پیش بینی قیمت سهام استفاده نمودند. مدل فازی TSK شاخص فنی را به عنوان متغیرهای ورودی در نظر میگیرد و نتیجه بدست آمده یک ترکیب خطی از متغیرهای ورودی میباشد. این مدل بر داده های شرکت سهامی الکترونیک تایوان آزمون شده است و نتایج بدست آمده حاکی از دقتی نزدیک به ۹۷٫۶ درصد در شاخص TSE و ۹۸٫۰۸ درصد در Media Tek میباشد.
کابودان در سال ۲۰۰۷ از برنامه ریزی ژنتیک و شبکه عصبی برای پیش بینی فضایی قیمت های مسکن استفاده نموده است. نتایج بدست آمده حاکی از برتری GP نسبت به شبکه عصبی میباشد.
گراسیا آلمانزا و تی سانگ[۷۴] در سال ۲۰۰۷ از برنامه ریزی ژنتیک برای یافتن نوسانات مهم در قیمت سهام استفاده نمودند. با بهره گرفتن از این روش نشان دادند که GP قابلیت یافتن مواردی نادری که با عدم توازن شدید مجموعه داده ها مواجهیم را دارد.
وانگ[۷۵] (۲۰۰۷) از شبکه های عصبی غیر خطی برای پیش بینی قیمت سهام استفاده کرده است. وی در این مطالعه روش و ناپایداری نامتقارن هیبریدی را در شبکه های عصبی مصنوعی به کار برده است تا با بهره گرفتن از این روش خطای پیش بینی را کاهش دهد. نتایج بدست آمده حاکی از این است که روش ناپایداری GREY-GIR-GARCH قابلیت پیش بینی بیشتری نسبت به سایر روشهای ناپایداری دارد.
لین و همکاران[۷۶] (۲۰۰۷) از الگوریتم ژنتیک برای پیش بینی بازار سهام استفاده کردند. نکته مهم برای موفقیت یک قانون تجارت انتخاب مقادیر برای همه پارامترها و ترکیبات آنها می باشد. لیکن دامنه پارامترها در یک محدوده بزرگ تغییر می کند و مشکلی که وجود دارد یافتن ترکیب بهینه پارامتر ها است. در این مقاله از الگوریتم ژنتیک برای فائق آمدن بر این مشکل استفاده شده است.
راج کومار و سیتابرا[۷۷] در سال ۲۰۰۷ به بررسی تغییرات رفتار جمعی قیمت سهام در یک بازار در حال رشد پرداختند. در این مقاله از یک ماتریس همبستگی متقاطع برای تغییرات قیمت سهام بازار بورس هند استفاده شده است.
هیوپ ره[۷۸] در سال ۲۰۰۷ از مدلهای هیبریدی، شبکه های عصبی و سری زمانی برای پیش بینی تلاطم[۷۹] شاخص قیمت سهام با دو رویکرد انحرافی و مستقیم استفاده کرده است.
چنگ و همکارانش[۸۰] در سال ۲۰۰۷ مدل سری زمانی فازی دو عاملی را برای پیش بینی شاخص سهام به کار بردند. در این مقاله شاخص سهام و حجم معامله به عنوان عواملی در نظر گرفته شده اند که در پیش بینی شاخص قیمت موثرند. نتایج حاکی از قابلیت خوب این مدل در پیش بینی شاخص سهام میباشد.
چن و همکارانش[۸۱] در سال ۲۰۰۷ از سری زمانی فازی بر اساس رشته Fibonacci در پیش بینی قیمت سهام استفاده نمودند. در این تحقیق یک دوره زمانی پنج ساله از داده ها برای TSMC[82] ویک دوره زمانی ۱۳ساله برای TAIEX[83] در نظر گرفته شده است. مدل بدست آمده نسبت به مدلهای سری زمانی فازی متداول برتری دارد.
ام تی سانگ و همکارانش[۸۴] در سال ۲۰۰۷ کاربرد NN5[85] را در پیش بینی قیمت سهام هنگ کنگ بررسی نمودند. این سیستم بر روی داده های سهام دو شرکت سهامی بانکداری هنگ کنگ و شانگهای آزمون شده است. این سیستم نرخ موفقیت کلی بیش از ۷۰ درصد را نشان می دهد.
سال سیدو سانز[۸۶] و همکارانش در سال ۲۰۰۵ کاربرد برنامه ریزی ژنتیک را در پیش بینی ورشکستگی شرکتهایی که فاقد بیمه عمر هستند، نشان دادند. در این مقاله کارکرد برنامه ریزی ژنتیک با سایر روشهای طبقه بندی مقایسه شده است.
پای و لین[۸۷] در سال ۲۰۰۵ از یک مدل هیبریدی آریما و ماشینهای بردار حمایتی[۸۸] در پیش بینی قیمت سهام تایوان استفاده نمودند. نتایج محاسبات بدست آمده از این تحقیق بسیار امیدوارانه است.
گروسان و همکارانش[۸۹] در سال ۲۰۰۵ از یک روش جدید برنامه ریزی ژنتیک با نام Multi Expression Programming برای پیش بینی دو شاخص سهام استفاده نمودند. عملکرد این روش را با یک شبکه عصبی مصنوعی که در آن الگوریتم Levenberg Marquardt استفاده شده بود، مدل نرو فازی تاگاکی سونجو[۹۰]، تفاضلی از شبکه عصبی پیش رونده[۹۱] و ماشین بردار پایه[۹۲] مقایسه نمودند.
ال تلبانی[۹۳] در سال ۲۰۰۴ بازده سهام مصر را با بهره گرفتن از روش های برنامه ریزی ژنتیک پیش بینی نمود.
پتوین و همکارانش[۹۴] در سال ۲۰۰۴ تحقیقی با عنوان ایجاد قوانین تجارت در بازار سهام با بهره گرفتن از برنامه ریزی ژنتیک انجام دادند. در این مقاله از برنامه ریزی ژنتیک به عنوان ابزاری برای ایجاد قوانین تجاری در کوتاه مدت در بازار سهام استفاده شده است. این محاسبات برای ۱۴ شرکت کانادایی در بورس تورنتو اجرا شده است. نتایج بدست آمده از این تحقیق نشان میدهد که روش زمان بندی این بازار ممکن است جایگزین مناسبی برای خرید و فروش[۹۵] باشد. همچنین نتایج حاکی از این است که قوانین داد و ستد ایجاد شده توسط GP زمانیکه بازار پایدار و یا در حال سقوط میباشد، مفید است. از طرف دیگر در شرایطی که بازار در حال صعود است نتایج به دست آمده از روش GP با روش خرید و فروش مطابقت ندارد.
فرانس ورث و همکارانش[۹۶] در سال ۲۰۰۴ از بزنامه ریزی ژنتیک برای پیش بینی بازده روزانه وجوه شاخص S&P500 استفاده کردند که به فرضیه کارایی بازار اشاره دارد. S&P500 یکی از شاخص هایی است که بیشترین مطالعه در سطح جهان بر روی آن انجام شده است.
ال تلبانی[۹۷] در سال ۲۰۰۴ بازده سهام مصر را با بهره گرفتن از روش های برنامه ریزی ژنتیک پیش بینی نمود.
پتوین و همکارانش[۹۸] در سال ۲۰۰۴ تحقیقی با عنوان ایجاد قوانین تجارت در بازار سهام با بهره گرفتن از برنامه ریزی ژنتیک انجام دادند. در این مقاله از برنامه ریزی ژنتیک به عنوان ابزاری برای ایجاد قوانین تجاری در کوتاه مدت در بازار سهام استفاده شده است. این محاسبات برای ۱۴ شرکت کانادایی در بورس تورنتو اجرا شده است. نتایج بدست آمده از این تحقیق نشان میدهد که روش زمان بندی این بازار ممکن است جایگزین مناسبی برای خرید و فروش[۹۹] باشد. همچنین نتایج حاکی از این است که قوانین داد و ستد ایجاد شده توسط GP زمانیکه بازار پایدار و یا در حال سقوط میباشد، مفید است. از طرف دیگر در شرایطی که بازار در حال صعود است نتایج به دست آمده از روش GP با روش خرید و فروش مطابقت ندارد.
فرانس ورث و همکارانش[۱۰۰] در سال ۲۰۰۴ از بزنامه ریزی ژنتیک برای پیش بینی بازده روزانه وجوه شاخص S&P500 استفاده کردند که به فرضیه کارایی بازار اشاره دارد. S&P500 یکی از شاخص هایی است که بیشترین مطالعه در سطح جهان بر روی آن انجام شده است.
جولیانا ییم (۲۰۰۲)[۱۰۱] مطالعه ای جهت مقایسه روش های پیش بینی شبکه عصبی و روشهای پیش بینی کلاسیک (ARMA, GARCH) انجام داده است. معیار ارزیابی MSE و می باشد. نتایج نشان دهنده برتری شبکه های عصبی نسبت به نمونههای ARMA وGARCH است.
کابودان (۲۰۰۰)[۱۰۲] از برنامه ریزی ژنتیک برای پیش بینی روزانه قیمت سهام ۶ شرکت آمریکایی استفاده نمود و بر اساس نتایج بدست آمده از این پیش بینی یک استراتژی تجارت را ارائه کرده است. همچنین از این روش استفده کرده است تا نشان دهد قیمتهای سهام قیمت های قابل پیش بینی هستند.
تان، پروخوف و ونچ (۱۹۹۵)[۱۰۳] سیستمی را طراحی نمودند که تغییرات قابل ملاحظه کوتاه مدت قیمت سهام را پیش بینی می کند. ابتدا پیش پردازشی روی داده ها صورت گرفته و سپس شبکه عصبی مدل سازی می شود که موقعیتهای خیلی خوب سوددهی را تخمین می زند.
ریفنز، زاپرانیس و فرانسیس (۱۹۹۴)[۱۰۴] با مدل سازی رفتار قیمت سهام توسط شبکه های عصبی، عملکرد آن را با مدل های رگرسیون مقایسه نموده اند، در این تحقیق از شبکه های عصبی به عنوان یک جایگزین برای تکنیکهای آماری کلاسیک و از این شبکه ها برای پیش بینی سهام شرکتهای بزرگ استفاده شده است. نتایج نشان می دهد که شبکه های عصبی نسبت به تکنیکهای آماری عملکرد بهتری دارند و مدلهای بهتری ارائه می دهند.
یون و اسویلز (۱۹۹۱)[۱۰۵] از اساتید دانشگاه میسوری برای پیش بینی قیمت سهام از یک شبکه عصبی چهار لایه با روش یادگیری پس انتشار (BP) استفاده نموده اند که نتیجه حاصل از آن به میزان قابل توجهی بهتر از روش سنتی می باشد. دقت شبکه در روش شبکه عصبی ۷۷٫۵% و روش سنتی ۶۵% می باشد.
۲-۴: نتیجه گیری و خلاصه فصل
در این فصل ابتدا مبانی نظری پژوهش بیان شد و سپس به بیان انواع روشهای پیش بینی توضیح داده شد و سپس بصورت خلاصه نتایجی از تحقیقات داخلی و خارجی صورت گرفته پیرامون پیش بینی شاخص قیمت سهام بیان گردید، با توجه به مطالب بیان شده در این فصل مواردی همچون زیر را میتوان نام برد که محقق در این پژوهش دنبال پاسخگویی به آن میباشد:
- در برخی از تحقیقات صورت گرفته مدلهای خطی بر مدلهای غیر خطی برتری نسبی را نشان میدهد ولی در عمده تحقیقات صورت گرفته این برتری متعلق به مدلهای غیر خطی است، دلیل این باید در سری زمانی شاخص قیمت جستوجو کرد، لذا محققین در این پژوهش با آگاهی از این موارد به دنبال ارائهای روشی جدید برای پیش بینی شاخص قیمت میباشد، بطوریکه هم اثرات خطی و هم غیرخطی سری زمانی شاخص قیمت در نظر گرفته شود، این مهم را با بهره گرفتن از روش تبدیل موجک به منظور ترکیب مدلهای خطی و غیرخطی دنبال خواهیم نمود.
- در مدلهای غیر خطی مورد مطالعه در تحقیقات پیشین هیچگونه روابطی قابل فهم استخراج نگردیده است تا سرمایه گذاران و سایر استفادهکنندگان بتوانند با توجه به روابط استخراج شده اقدام به پیش بینی آینده تصمیمات خویش باشند، ما در این پژوهش به دنبال استخراج روابطی منطقی بین داده های پژوهش هستیم بطوریکه الگوهای استفاده شده توسط مدلهای غیر خطی برای خواننده قابل فهم باشد، این مهم در این پژوهش با ترکیب الگوریتم ژنتیک با تئوری فازی صورت خواهد گرفت.
فصل سوم
روش تحقیق
۳-۱: مقدمه
هدف از نگارش این فصل، بحث و بررسی پیرامون روش و متدولوژی تحقیق است. ابتدا، روش انجام تحقیق بیان خواهد شد سپس به معرفی جامعه آماری تحقیق و معرفی متغیرهای مورد استفاده در تحقیق می پردازیم. در قسمت بعدی فرضیات تحقیق بیان می شود. سپس مدلهای مورد استفاده توضیح داده می شود. در نهایت روش های متداول ارزیابی عملکرد مدلهای پیش بینی جهت انتخاب مدل پیش بینی برتر را بر میشماریم.
۳-۲: روش تحقیق
این تحقیق از نظر هدف، کاربردی و از نوع تحقیقات شبه تجربی است. در این تحقیق به منظور پیش بینی شاخص قیمت بورس اوراق بهادار تهران؛ از مدل سری زمانی ARIMA، شبکه عصبی درک چندلایه(MLP) و تکنیک استخراج قانون از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک فازی و استفاده از تبدیل موجک به منظور تفکیک نوسانات داده ها و همچنین کاهش سطح خطای مدلهای مورد استفاده میباشد. اما با توجه به اینکه به طور مطلق نمی توان در مورد توان پیش بینی یک مدل نظری داد، پس باید از مدل دیگری برای مقایسه نتایج استفاده کرد. از این رو، به منظور انتخاب مدل بهینه، عملکرد آنها مورد مقایسه قرار گرفت. این تحقیق نسبت به تحقیقات گذشته دارای دو مزیت ملموس و مهم است؛ اول اینکه در این تحقیق به منظور بهبود مدل پیش بینی از تبدیل موجک استفاده شده است، همچنین از آنجائیکه شبکه های عصبی مانند جعبهی سیاه است و چگونگی روابط بین متغیرها را نمایان نمی کند، از این رو از تکنیک استخراج قانون استفاده شده است؛ تکنیک استخراج قانون مورد استفاده در این پژوهش الگوریتم ژنتیک فازی میباشد. مراحل کلی تحقیق به این صورت میباشد که بر مبنای ادبیات تحقیق، مدلهای تحقیق تدوین گردید. سپس متغیرهای مورد نظر تحقیق از منابع اطلاعاتی و پایگاه های اطلاعاتی مختلف استخراج شد و در نهایت مدلهای مورد استفاده برای مورد برازش قرار گرفت. درنهایت برای تعیین مدل برتر از معیار های ارزیابی عملکرد مدل استفاده گردید. لازم به ذکر است تجزیه و تحلیل داده ها با بهره گرفتن از نرم افزار MATLAB و نرم افزار اقتصادی Eveiws انجام گرفت.
۳-۳: جامعه آماری و متغیرهای تحقیق
۳-۳-۱: جامعه آماری
از آنجائیکه بازار سرمایه در هر کشوری آینهی تمام نمای وضعیت اقتصادی آن کشور است و شاخص قیمت بیانگر وضعیت بازار سرمایه در زمان فعال بودن بازار میباشد لذا سری زمانی داده های روزانه شاخص قیمت بورس اوراق بهادار تهران از سال ۱۳۸۴ لغایت ۱۳۸۹ به عنوان جامعه آماری تحقیق انتخاب گردیده است. داده های مزبور از سایت سازمان بورس و اوراق بهادار تهران استخراج گردیده است.
۳-۳-۲: متغیرهای تحقیق
در این تحقیق با توجه به نتایج تحقیق رعیت(۱۳۸۸)، سجادی و همکاران(۱۳۸۸) و صمدی و همکاران(۱۳۸۷) قیمت روزانه سبد نفت ایران، قیمت جهانی طلا، قیمت روزانه ارز دولتی و شاخص روزانه S&P500 بورس نیویورک به عنوان متغیرهای مستقل(ورودی شبکه عصبی) انتخاب شدند، داده های فوق به ترتیب از سایت کتابخانه سازمان اوپک، پایگاه اطلاعاتی سایت بانک جهانی، سایت بانک مرکزی جمهوری اسلامی ایران و پایگاه اطلاعاتی سایت بانک جهانی برای دوره مورد مطالعه استخراج گردید.
۳-۴: سوالات و فرضیه های تحقیق
سؤالات تحقیق به شرح زیر قابل طرح است:
- آیا سری زمانی خطی ARIMA مدل مناسبی برای پیش بینی قیمت سهام است؟
- آیا شبکه عصبی درک چند لایه(MLP) در پیش بینی قیمت سهام بر مدل خطی ARIMA برتری دارد؟
- آیا تکنیک استخراج قانون(ExtractionRule ) از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد؟
- آیا تکنیک استخراج قانون(ExtractionRule ) از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک در پیش بینی قیمت سهام بر شبکه عصبی درک چند لایه(MLP) برتری دارد؟
- آیا ترکیب مدل ARIMA با شبکه عصبی برای پیش بینی قیمت سهام با بهره گرفتن از تبدیل موجک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد؟
- آیا مدل ترکیبی تبدیل موجک، شبکه عصبی و الگوریتم ژنتیک فازی در پیش بینی شاخص قیمت نسبت به بقیه مدلهای ارائه شده از دقت بالاتری برخوردار است؟
بنابراین فرضیات اصلی تحقیق به صورت زیر خواهد بود:
فرضیه۱) مدل خطی ARIMA مدل مناسبی برای پیش بینی قیمت سهام بدست می دهد.
فرضیه۲) شبکه عصبی درک چند لایه(MLP) در پیش بینی شاخص قیمت نسبت به مدل خطی ARIMA عملکرد بهتری را نشان می دهد.
فرضیه۳) تکنیک استخراج قانون(ExtractionRule ) از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد.
فرضیه۴) مدل ترکیبی ARIMA، شبکه عصبی درک چند لایه و تبدیل موجک نتیجه قابل قبولی برای پیش بینی قیمت سهام بدست می دهد.
فرضیه۵) مدل ترکیبی تبدیل موجک، شبکه عصبی درک چند لایه و الگوریتم ژنتیک فازی در مقایسه با سایر مدلها ارائه شده از دقت بالاتری برخوردار است.
۳-۵: آماده سازی داده های ورودی
آماده سازی داده ها یکی از مراحل پیچیده کاربرد شبکه های عصبی است. بخشی از این پیچیدگی به علت انتخاب داده ها و مثالهای صحیح میباشد و بخش دیگر به تغییر مقیاس داده های آموزشی ورودی ها و خروجیها بر میگردد، چرا که بهترین وضعیت برای شبکه های عصبی هنگامی است که تمام ورودی ها و خروجی ها بین صفر و یک باشند. یکی از دلایل تأکید بر قرار داشتن ورودی ها در دامنه صفر و یک، این است که توابع انتقال (مانند تابع سیگموئید) نمی توانند بین مقادیر خیلی بزرگ فرق بگذارند. از طرف دیگر، این کار موجب سادگی بیشتر نیز می شود، زیرا خروجیها و ورودیهای لایه های بعدی، در دامنه صفر تا یک قرار میگیرند. بنابراین با بهره گرفتن از فرمول زیر کلیه داده ها نرمال شدند:
(۳-۱)
ما در این پژوهش در کلیه مدلهای آماری استفاده شده از داده های نرمال شده استفاده میکنیم.
۳-۶: معرفی مدلهای تحقیق
امروزه پیش بینی قیمت سهام مورد توجه محققین قرار گرفته و روش های متنوعی نیز در این رابطه بکار گرفته شده است. یکی از جدیدترین روشهای پیش بینی، رویکرد شبکه های عصبی مصنوعی می باشد. شبکه های عصبی از جنبه توپولوژی، ساختاری و روش های یادگیری به انواع مختلفی تقسیم می شوند و هر یک در کاربردهای خاصی عمـلکرد مناسـبی از خود نشــان می دهند. شبکه عصبی درک چند لایه یکی از متـداول ترین شبکه های کاربردی است. در مباحث نظری اثبات شده است که شبکه MLP در صورت انتخاب صحیح ساختار مناسب داخلی، قادر است هر گونه سیستم غیر خطی را مدل کرده و شبیه سازی نماید. با توجه به اینکه به طور مطلق نمی توان در مورد توان پیش بینی یک مدل نظری داد، پس باید از مدل های دیگری برای مقایسه نتایج استفاده کرد. در این تحقیق، به منظور پیش بینی شاخص قیمت بورس اوراق بهادار تهران ابتدا از روش سری زمانی خطی ARIMA استفاده میگردد، سپس پیش بینی با شبکه عصبی درک چند لایه تکرار میگردد؛ از آنجاکه شبکه های عصبی روابط بین متغیرها را بیان نمیکند لذا برای رفع این مشکل شبکه های عصبی از الگوریتم ژنتیک استفاده میکنیم و با بهره گرفتن از وزنهای بهینه بدست آمده از شبکه عصبی مصنوعی، الگوریتم طراحی شده آموزش داده می شود و دوباره پیش بینی با این روش تکرار می گردد. در نهایت با بهره گرفتن از تبدیل موجک اقدام به تفکیک نوسانات سری زمانی شاخص قیمت بورس اوراق بهادار تهران می نماییم، این تبدیل سری زمانی را به دو سری بر اساس نوسان در واحد زمان تفکیک مینماید، ما در این پژوهش نوسانات با فرکانس بالا را با بهره گرفتن از شبکه عصبی و نوسانات با فرکانس پایین را با بهره گرفتن از مدل سری زمانی خطی ARIMA پیش بینی می نماییم؛ سپس بوسیله عکس تبدیل موجک گرفته شده، پیش بینی های حاصله را با هم ترکیب مینماییم تا پیش بینی نهایی حاصل گردد.
۳-۶-۱: مدل سری زمانی خطی ARIMA
در فرایند p,d,q ,ARIMA(p,d,q)به ترتیب بیانگر تعداد جملات خود رگرسیو، مرتبه تفاضل گیری وتعداد جملات میانگین متحرک میباشند. در صورتی کهd برابر با صفر گردد، فرایند ARIMAتبدیل به فرایند ARMAمیشود. معمولا برای تخمین الگویARIMA و ARMA از روش باکس- جنکینز استفاده میکنند؛ که دارای سه مرحله شناسایی، تخمین، تشخیص دقت پردازش میباشد و درنهایت پیشبینی سری زمانی به آن اضافه میشود. تعداد جملات خودرگرسیو و تعداد جملات میانگین متحرک را میتوان با بهره گرفتن از توابع خودهمبستگی(AC) و خودهمبستگیجزئی(PAC) تعیین نمود و در ادامه توسط ضابطه های آکائیک[۱۰۶] و یا شوارتز- بیزین[۱۰۷] مورد ارزیابی قرار داد. برای پیشبینی دادههای سری زمانی بوسیله ARIMA، ابتدا مانای سری زمانی را بررسی کرده و مرتبه انباشتگی (d) تعیین میشود. لازم به ذکر است که در تحقیق حاضر، برای تخمین مدل ARIMA، از نرمافزارEviews استفاده شده است.
۳-۶-۲: شبکه پرسپترون چند لایه (MLP)
بعد از آن که در دهه ۸۰ میلادی مجددا شبکه های عصبی احیا شدند، شبکه پرسپترون چند لایه ، به عنوان یکی از کارامدترین آنها در حل مسائل لاینحل غیر خطی مطرح شد. این شبکه به خصوص در زمینه پیش بینی متغیرهای مالی و اقتصادی، از قابلیت بالایی برخوردار می باشد .
ویژگی های مهم شبکه پرسپترون چند لایه را به صورت زیر می توان بیان کرد :
۱ - حداقل دارای یک لایه میانی می باشد .
۲ - توابع فعال سازی غیر خطی و مشتق پذیر در لایه میانی استفاده می کند .
۳ - الگوریتم یادگیری در آن طوری طراحی شده است که خطا را از لایه خروجی را به لایه های قبلی منتقل می سازد .
۴ -تصحیح خطا از لایه آخر آغاز شده ، سپس لایه های قبلی تصحیح می شوند.
۵ - اتصالات در این شبکه از درجه بالایی برخوردار می باشد .
علت اصلی موفقیت این شبکه را بایستی در نوع الگوریتم یادگیری این شبکه جستجو کرد. الگوریتم مورد استفاده در آن ، الگوریتم پس انتشار خطا می باشد. این الگوریتم همواره به دنبال حداقل سازی مربعات خطا می باشد. این دقیقا شبیه تخمین ضرایب رگرسیون از روش OLS در آمار و اقتصاد سنجی می باشد. بنابراین هر شبکه عصبی از یک تابع خطایی همانند رابطه زیر پیروی می کند .
تابع خطا در شبکه MLP :
(۳-۲)
در این رابطه e بیانگر مقدار خطای مشاهده شده می باشد .
هنگام طراحی یک شبکه باید پارامترهای ساختار شبکه، نوع الگوریتم آموزش، نرخ یادگیری، تعداد لایه های شبکه و تعداد نرونها در هر لایه، و تعداد تکرارها برای هر الگو در خلال آموزش را مد نظر داشت.
آموزش را می توان هم از لحاظ نوع آموزش و هم از لحاظ قانون یادگیری طبقه بندی کرد. نوع آموزش در شبکه پرسپترون چند لایه، آموزش با نظارت میباشد. اما قانون یادگیری در آن یادگیری پس از انتشار یا دلتای تعمیم یافته می باشد.
قانون دلتا را می توان به صورت زیر بیان کرد .
(۳-۳)
(۳-۴)
(۳-۵)
= مقدار خروجی مطلوب
=مقدار خروجی به دست آمده
=نرخ یادگیری (پارامتر تنظیم سرعت یادگیری شبکه می باشد)
= وزن مربوطه
=ورودی به نرون وخروجی از نرون
اثبات این قانون از روش تندترین فرود میباشد که بیان می کند با حرکتهای پی در پی خلاف جهت بردار گرادیان خطا میتوان به نقطه حداقل خطا رسید. این ادعا را نیز می توان با بهره گرفتن از بسط تیلور تایید کرد (هیکین،۱۹۹۹). در این شیوه وزنها به وسیله یک مقدار با مشتق (گرادیان) اول خطای بین خروجی مطلوب و خروجی واقعی و با توجه به مقدار وزنها تعدیل مییابد. در این روش هدف کاهش تابع خطا و رسیدن به حداقل مطلق است .
(۳-۶)
(۳-۷)
(۳-۸)
(۳-۹)
= ورودی به نرون وخروجی از نرون در لایه ماقبل آخر
= بردار گرادیان محلی در لایه آخر
فرایند یادگیری و محاسبات در نرون ها و لایه های پنهان، با بهره گرفتن از معادله ورودی-خروجی زیر صورت می گیرد:
(۳-۱۰)
جائیکه وزن ارتباطی بین نرون iام در لایهی (۱-k) و نرون pام در لایهی kام؛ خروجی نرون pام در لایهی kام و تابع فعال سازی سیگموئید نرون pام در لایهی kام است.
همچنین تابع فعال سازی سیگموئید به صورت زیر است:
(۳-۱۱)
ساختار یک شبکه MLP سه لایه با چهار ورودی، یک لایهی پنهان و یک خروجی در نگارهی ۳-۱ نشان داده شده است.
شکل۳-۱:ساختار MLP
به منظور آموزش شبکه MLP، و دستیابی به پیش بینی مطلوب، باید شبکه را تحت پارامترهای مختلف که همان ویژگی های شبکه است مورد آموزش و یادگیری قرار داد. به عبارت دیگر با تغییر دادن این پارامترها، شبکه وزنهای خروجی متفاوتی خواهد داد که در نهایت وزنی که کمترین خطا را منجر شود، به عنوان وزن نهایی و پارامترهایی که موجب دستیابی به این وزن شدند به عنوان پارامترها و مشخصه های شبکه معرفی می شوند. این پارامترها به صورت زیر است:
تعداد لایه ها ی شبکه
استفاده از یک شبکه تک لایه نمیتواند پیش بینی خوبی برای ما در حل مسائل پیچیده غیر خطی ارائه کند (زیرا تابع فعالسازی آن خطی می باشد). در واقع تمام شبکه های عصبی با بیش از یک لایه، در بخشی از کار خود از توابع غیر خطی فعال ساز استفاده می کنند. استفاده از توابع غیرخطی فعال ساز باعث می شود که توانایی شبکه های عصبی در مدلکردن مسائل غیرخطی بروز نماید و جوابهای مطلوبی در خروجی به ما بدهند. این ویژگی با یک تابع فعال سازی غیر خطی مشتق پذیر و پیوسته اتفاق میافتد. بنابراین برای یک پیش بینی دقیق بایستی از شبکه های عصبی با بیش از یک لایه استفاده شود، که در لایه های میانی آن توابع غیرخطی وجود داشته باشد. البته توجه کرد که افزایش بیش از حد لایه های شبکه های عصبی (بیش از ۳ لایه ) نیز اصلاً توصیه نمی شود.
تعداد نرون های هرلایه
مسئله بعدی تعیین تعداد نرونهای لایه های میانی و خروجی است. اگر هدف از استفاده از شبکه های عصبی پیش بینی باشد، در لایه خروجی بایستی یک نرون داشته باشیم. اما اگر به منظور طبقه بندی یا شناسایی الگو از شبکه های عصبی استفاده شود، میتوان در لایه خروجی از چند نرون استفاده کرد. در تعیین تعداد نرونهای لایه میانی نیز روشهای متعددی ارائه شده است که هیچ کدام از آنها عموما کلیت ندارد. اما بهترین روش برای تعیین تعداد نرون ها، روش آزمون و خطا می باشد. با افزایش تعداد نرونهای لایه پنهان از یک مقدار کوچک به مقادیر بزرگ، ابتدا مجموع خطا کاهش می یابد اما پس از رسیدن مقدار نرونها به اندازه معین این خطا دوباره افزایش می یابد. بدین روش می توان بهترین اندازه شبکه را انتخاب نمود.
نرخ یادگیری
نرخ یادگیری یکی از پارامترهای تعیین کننده در سرعت یادگیری شبکه های عصبی است و در کارائی یادگیری شبکه نقش مؤثری دارد. این نرخ در فاصلهی بین ۰ و ۱ اختیار می شود. عموماً نرخ یادگیری شبکه های عصبی به صورت تصادفی و آزمون و خطا بدست می آید. اما در اکثر کاربردهای عملی، این نرخ بین ۱/۰ و ۳/۰ اختیار می شود. نرخ یادگیری بالاتر باعث می شود شبکه سریعتر یادگیری کند اما وقتی که تنوع داده های ورودی زیاد باشد، شبکه به جای یادگیری حفظ خواهد کرد و کارائی شبکه پائین خواهد آمد.
تعداد تکرار
الگوریتم یادگیری وزنهای خروجی را پس از محاسبهی هر دسته خروجی تغییر میدهد و به اصطلاح به روز می کند. این الگوریتم به تکرار فرایند آموزش برای رسیدن به اوزان نیاز دارد. تعداد تکرار هر فرایند آموزش نیز از طریق آزمون و خطا بدست می آید. نقطهی بهینه تعداد تکرار، نقطه ای است که شبکه بهترین یادگیری را داشته باشد.
شتاب شبکه
پارامتر شتاب برای افزایش سرعت همگرایی شبکه استفاده می شود. به هر حال، اگر شتاب شبکه بیش از حد زیاد انتخاب شود، می تواند خطر دور شدن از هدف را افزایش دهد که می تواند باعث ناپایداری و عدم ثبات شبکه گردد. معمولاً ضریب شتاب پایین عملکرد بهتری در آموزش بهینه شبکه از خود نشان می دهد.
۳-۶-۳: الگوریتم ژنتیک
انسان ها همیشه با الهام از طبیعت دست به ساخت وسایل مورد نیاز و ارائه روشهایی زده اند که اکثرا در بین موارد مشابه خود بهترین بوده اند. طبیعت همواره بزرگترین و بهترین معلم انسان ها بوده است و الگوریتم ژنتیک یکی از روشهایی است که بشر از طبیعت الهام گرفته و در جهت نیل به اهداف خود از آن بهره برده است. الگوریتم ژنتیک یک روش بهینه سازی عددی است که برپایه اصول تکامل داروین بوده و در آن از ژنتیک طبیعی الهام گرفته شده است. این روش یکی از روشهای مجموعه الگوریتم های تکاملی است.
در طبیعت افراد یک جامعه برای دستیابی به منابعی از قبیل غذا، آب و سرپناه با یکدیگر رقابت می کنند. در این بین افرادی که به منابع بیشتری دست یابند، امکان بیشتری جهت بقا، نسبت به سایر افراد برای خود ایجاد کرده اند و با تولید نسل بیشتر نسبت به افراد ضعیف، نمایندگان بیشتری نسبت به سایر افراد در نسلهای بعدی خواهند داشت. دسترسی به منابع بیشتر بیانگر توانایی بیشتر این افرد نسبت به سایرین در سازگاری با شرایط محیط زندگی میباشد.
الگوریتم ژنتیک با الهام از تئوری تکامل و اصول ژنتیک و وراثت به جستجوی راه حل مناسب برای مسائل می پردازد(گلدبرگ[۱۰۸]،۱۹۸۹). بدین منظور ابتدا چندین پاسخ تصادفی برای مسئله مورد نظر تولید شده و در مراحل بعدی این پاسخهای ابتدایی با بهره گرفتن از اصول ژنتیک به تکامل رسیده و به پاسخ مناسب تبدیل می شوند.
در ادامه مراحل الگوریتم ژنتیک شرح داده می شود(هوبت[۱۰۹]،۱۹۸۰)
- تولید نسل اول:
تولید پاسخ تصادفی برای مسئله، که هر یک از این پاسخ ها در قالب یک کروموزوم بصورت مناسبی کد می شوند.
- ارزش گذاری:
تابع معیار با توجه به میزان موفقیت هر کروموزوم در حل مسئله ارزش آنها را معین می کند. به بهترین کروموزوم هر نسل کروموزوم نخبه[۱۱۰] گفته می شود.
- کروموزم ها بر حسب تابع معیار به صورت نزولی مرتب شده و فقط X % از کروموزوم ها حفظ شده و بقیه به دور ریخته می شوند. احتمال حفظ هر کروموزوم با میزان شایستگی آن می باشد به نحوی که کروموزوم هایی که ارزش بیشتری داشته باشند، احتمال بیشتری برای بقا دارند. برای جایگزینی کروموزوم های دور ریخته شده، کروموزوم های باقیمانده بصورت دوبدو به عنوان والدین انتخاب می شوند تا کروموزوم های فرزند را تولید کنند. برای انتخاب والدین روش های متفاوتی وجود دارد. در این پژوهش از روش Tournament Selection استفاده شده است. در این روش ابتدا مجموعه کوچکی از کروموزوم ها به صورت تصادفی انتخاب شده و سپس از بین این کروموزوم ها ، دو کروموزومی که دارای ارزش بیشتری هستند به عنوان والدین انتخاب می شوند.
- تبادل ژنتیکی[۱۱۱]:
کروموزوم های والدین با مبادله کردن ژن های خود کروموزوم های فرزند راایجاد می کنند. برای مبادله ژن ها روش های مختلفی وجود دارد. در این پژوهش از روش Two Point Crossover استفاده شده است. در این روش که در نگاره ۳-۲ قابل مشاهده است دو مکان از کروموزوم های والدین انتخاب می شود. در این حالت برای تشکیل کروموزوم فرزند، رشته های ژن از آغاز تا اولین مکان تعیین شده از یک والد، رشته های ژن بین دو مکان تعیین شده، از والد دوم و بقیه ژن ها از والد اولی کپی می شوند.
کروموزوم والد۱ کروموزوم والد۲ کروموزوم فرزند |
Two Point Crossover شکل۳-۲:
- جهش[۱۱۲]:
تعدادی از ژن های کروموزوم های نسل جدید[۱۱۳] به غیر از کروموزوم نخبه به صورت تصادفی انتخاب شده و مقادیر آنها تغییر داده می شود. بدین وسیله می توان به کروموزوم های کاملاً جدید دست یافت.
- بازگشت به مرحله ۲ و تکرار مراحل تا زمانی که شرایط توقف که عبارتند از همگرایی الگوریتم و عدم تغییر بهترین کروموزوم برای تعداد نسل های از پیش تعریف شده و تکمیل شدن تعداد نسل های از پیش تعریف شده فراهم گردد. ساختار الگوریتم ژنتیک بصورت نگاره ۳-۳ می باشد.
تعیین تابع معیار، نوع کروموزوم ها، پارامترها و عملگرهای الگوریتم ژنتیک
تولید نسل اول
تعیین ارزش هر کروموزوم
انتخاب والدین
بررسی شرایط توقف
تبادل ژنتیکی
جهش
شکل۳-۳: ساختار الگوریتم ژنتیک
۳-۶-۴: استخراج قانون از شبکه های عصبی
عیب مهم و اساسی شبکه های عصبیمصنوعی، عدم توانایی در توضیح و تفسیر است (اندرسن[۱۱۴]و همکاران،۱۹۹۶). اگر چه شبکه های عصبی در بسیاری از کاربردهای خود، موفقیت آمیز بوده است، اما دانش مربوطه در توابع انتقال و وزن های نرونها مخفی می شوند(بولوگنا[۱۱۵]،۲۰۰۴). به هرحال آنها مشابه جعبه های سیاه ممتد هستند که فهم روش حل یک مسئله توسط شبکه های عصبی را دشوار کرده است(مانتاس[۱۱۶] و همکاران،۲۰۰۶). بنابراین اطلاعاتی که توسط شبکه عصبی برای دست یابی به پاسخ، بکار گرفته شده است، برای کاربران شفاف نیست و ممکن است در برخی موارد مسئله ساز شود(هوانگ و ژینگ[۱۱۷]،۲۰۰۲).
برای حل این مسئله، محققان مایل بودند که یک تکنیک ملموس و قابل فهم برای شبکه های عصبی ایجاد نمایند. آنها اعتقاد داشتند این هدف می تواند با استخراج قانون تولید شده از شبکه های عصبی بدست آید(هوانگ و ژانگ،۲۰۰۲). شکل مفهومی آن در نگاره ۳-۴ نشان داده شده است.
شبکه عصبی
الگوریتم استخراج قانون
مجموعه قوانین
شکل۳-۴: شکل مفهومی استخراج قانون از شبکه های عصبی
از یک دیدگاه می توان تکنیکهای استخراج قانون را به سه دسته تقسیم کرد: تجزیه ای[۱۱۸]، مبتنی بر آموزش[۱۱۹] و منتخبان[۱۲۰]. روش تجزیهای فعالیت و وزنهای لایهی پنهان را تجزیه و تحلیل می کند؛ در مقابل، روش مبتنی بر آموزش، شبکه عصبی را به عنوان یک جعبهی سیاه در نظر گرفته و قوانین را با توجه به فعالیت ورودی و خروجی بدست می آورد. هدف این روش استخراج قوانین نمادین است به طوری که ارتباط بین ورودی و خروجی را با دقت بدست می آورد. در نهایت، روش منتخبان، از ترکیب اجزای دو روش فوق پیروی می کند(تیکل[۱۲۱] و همکاران،۱۹۹۷).
در تکنیک استخراج قانون از شبکه های عصبی با بهره گرفتن از الگوریتم ژنتیک، از الگوریتم های مبتنی بر آموزش و منتخبان، بیشتر استفاده می شود.
نکتهی قابل ذکر در مورد این تحقیق آن است که به منظور استخراج قوانین از شبکه عصبی با الگوریتم ژنتیک، داده ها از قوانین فازی استفاده شده و ورود و خروج داده ها به صورت فازی بوده است. از این رو مفاهیم اولیه علاوه بر مفاهیمی که در قسمت الگوریتم ژنتیک بیان شد، در استخراج قوانین کاربرد دارد، در زیر شرح داده شده است:
تابع عضویت[۱۲۲]: با بهره گرفتن از توابع عضویت فازی، هریک از متغیرهای ورودی از قالب عددی به قالب فازی (زبانی) تبدیل می شوند.
پایگاه اطلاعات: این بخش حاوی اطلاعات لازم در مورد متغیرهای ورودی و خروجی و روابط حاکم بین آنها می باشد .این بخش خود از دو قسمت پایگاه داده[۱۲۳] ها و پایگاه قوانین[۱۲۴] تشکیل می شود.
پایگاه داده ها: این بخش تعاریف لازم در مورد توابع عضویت مربوط به عبارات کلامی و توابع مقیاس گذاری را فراهم می کند.
پایگاه قوانین: این بخش از قوانینی به فرم جملات شرطی “اگر- آنگاه” تشکیل شده است که با بهره گرفتن از آنها خروجی تعیین می شود.
سیستم استنتاج: در این بخش با توجه به ورودی فازی کننده[۱۲۵]، اطلاعات پایگاه قوانین و با بهره گرفتن از روش های استنتاج فازی، خروجی کنترل کننده تعیین می شود.
غیرفازی کننده[۱۲۶]: غیر فازی کننده، مجموعه فازی خروجی سیستم استنتاج را به یک نقطه غیر فازی می نگارد. در حقیقت این بخش، نقطه ای را که بهترین نماینده مجموعه فازی است، مشخص می کند.
در نگاره ۳-۵ شکل مفهومی الگوریتم ژنتیک فازی مورد استفاده بیان شده است.
پایگاه اطلاعات
رابط خروجی
رابط ورودی
پروسه یادگیری بر اساس الگوریتم ژنتیک
شکل۳-۵: الگوریتم ژنتیک فازی
۳-۶-۵: تبدیل موجک
ویولت[۱۲۷] در لغت به معنی یک موج کوچک می باشد، یک تبدیل موجک دارای ویژگیهای زیر می باشد:
- تبدیل یک سیگنال به مجموعه ای از موجکها است.
- ایجاد و ارائه یک مسیر برای آنالیز نمودن شکل موجهای مختلف در دو حوزه زمان و فرکانس.
- امکان ذخیره نمودن سیگنالها با بازدهی بسیار بهتر نسبت به تبدیل فوریه.
- توانائی تقریب سیگنالها با کیفیتی بسیار بهتر.
موجکها توابعی هستند که مقدار محدودی دارند و مقدار متوسط آنها برابر صفر می باشد. این موجکها دارای انواع متعددی می باشند که در ادامه توضیح بیشتری در این باره داده خواهد شد. در نگاره۳-۶ یک موجک از خانواده دبوچی[۱۲۸] نشان داده شده است.
شکل۳-۶: یک موجک از خانواده دبوچی
تبدیل موجک پیوسته را می توان بصورت مجموع حاصلضرب سیگنال اصلی در موجکهای تغییر مقیاس یافته وانتقال داده شده در زمان نمایش داد.
(۳-۱۲)
در رابطه بالا موجک مادر تغییر مقیاس یافته به اندازهS و انتقال یافته در زمان به اندازه می باشد. نتیجه تبدیل موجک پیوسته، ضرایب موجک C می باشند که توابعی از مقیاس و ضریب جابجائی می باشند. با ضرب کردن هر کدام از این ضرایب در موجک های مادر تغییر مقیاس یافته و جابجا شده در زمان می توان موجک های تشکیل دهنده سیگنال اصلی را بدست آورد، که در شکل ۳-۷ این روند نشان داده شده است.
شکل۳-۷: تجزیه یک سیگنال توسط تبدیل موجک
۳-۶-۵-۱: موجک مادر
موجک مادر یک تابع مبنا می باشد که سایر موجکها از طریق تغیر مقیاس دادن و شیفت دادن این موجک اصلی تولید می شوند. این موجکها دارای مبنا یکتا نیستند و بسته به کاربرد، انواع گوناگونی از موجکهای مادر را می توان انتخاب نمود و این متنوع بودن موجک های مادر باعث تفاوت اصلی و برتری ویژه تبدیل موجک بر سایر تبدیل ها شده است.
هر کدام از انواع موجکها در استفاده خاصی بهترین نتیجه را بهمراه دارند، بنابراین با توجه به کاربرد مورد نیاز، بایستی توجه نمود که از کدام موجک بایستی استفاده نمود. در این تحقیق شناسائی خطا و تخمین نوسانات پراهمیتترین مساله محسوب می شود. بنابراین بایستی خانواده ای از موجکها که برای این امر مناسب می باشند را انتخاب نمود. موجک های خانواده دبوچی[۱۲۹] (db) برای این امر، نسبت به سایر موجکها، دارای بهترین کارائی می باشند.
با توجه به مبانی تعریف شده برای تبدیل موجک در فصل اول تحقیق، ساختار مدل مورد استفاده در این پژوهش بصورت زیر میباشد:
سری اصلی
تبدیل موجک
مجموع توابع جزئیات
سطح هموارشده
ARIMA
شبکه عصبی
پیش بینی سری اصلی
تبدیل موجک معکوس
پیشبینیسریاصلی
شکل ۳-۸: ساختار مدل ترکیبی
آنالیز موجک قادر به تجزیهی سریهای زمانی، در مقیاسهای زمانی مختلف میباشد (این و همکاران، ۲۰۰۸)؛ به طوری که با تحلیلهای فرکانس زمانی، کاربردهای فراوانی را در مدلسازی سریهای زمانی اقتصادی و مالی فراهم آورده (جنسای و همکاران، ۲۰۰۲) و به صورت گسترده در سریهای زمانی غیر ایستا به کار بسته شده است (ناسون و ون ساچس، ۱۹۹۹). در آنالیز موجک، سیگنال به صورت ترکیب خطی از توابع موجک نشان داده می شود (سفتر و همکاران، ۲۰۰۷، ۲۰۰۸)، به طوری که. بر اساس طول داده ها، دو موج اصلی موجک ها وجود دارد: اولین موج، تبدیل موجک پیوسته (CWT)، که برای کار با سریهای زمانی تعریف شده بر روی محور حقیقی کامل طراحی شده است؛ موجک دوم، تبدیل موجک گسسته (DWT) میباشد که در جداسازی سری داده در اجزاء فرکانس متفاوت، به منظور آزمایش عمق سری داده مطالعه می شود (کونلون و همکاران، ۲۰۰۸). موجکها دو نوع هستند، موجک پدر و موجک مادر ، به طوری که:
(۳-۱۳)
قسمت های صاف و با فرکانس کم یک سیگنال با بهره گرفتن از موجک پدر نشان داده شده و موجک مادر، به منظور نشان دادن قسمت های پر جزئیات با فرکانس بالا استفاده میشوند. موجکهای پدر و مادر، به ترتیب به صورت رابطه (۳-۱۴) و (۳-۱۵) نشان داده میشوند:
(۳-۱۴)
(۳-۱۵)
توابع موجک تقریب زننده و ، نسخههای ترجمه شده و مقیاسبندی شده ی و میباشند؛ که در آن فاکتور مقیاس یا اتساع میباشد. عادیترین موجکها استفاده شده، موجکهای متعامد، مانند هار، سیملتس و دابوچی میباشند (فرناندز، ۲۰۰۶). تخمین سری موجک متعامد به یک سیگنال ، به صورت رابطه (۳-۱۶) به دست می آید:
(۳-۱۶)
در رابطه (۳-۱۶)، J تعداد مقیاسهای چند تحلیلی و k دامنهای از یک تا تعداد ضرایب در اجزاء متناظر میباشد. رابطه (۳-۱۷) و (۳-۱۸)، ضرایب جزئیات ، نوسانات فرکانس بالاتر و انحرافات مقیاس ریز روند را نشان می دهند؛ به علاوه ضرایب ، ضرایب صاف بوده و روند را میگیرند.
(۳-۱۷)
(۳-۱۸)
تقریب سری موجک از یک سیگنال اصلی ، به صورت رابطه (۳-۱۹)، از بخشهای سیگنال جزئیات و سیگنال صاف تشکیل شده است:
(۳-۱۹)
عبارات موجود در رابطه (۳-۱۹)، یک تجزیهی سیگنال در اجزاء سیگنال متعامد را، در مقیاسهای مختلف نشان میدهد. تخمین رابطه (۳-۱۹)، یک تجزیه چند تحلیله (MRD) نامیده می شود. بنابراین هر نقطه می تواند به عنوان مجموعه ای از جزئیات موجک و سطح صاف موجک، بر روی مقیاسها زمانی مختلف تجزیه شود. هنگامیکه که سری زمانی را در J مقیاس تجزیه میکنیم، اگر داده های ما به صورت روزانه باشند، مقیاس موجک به این صورت است که مقیاس یک، نوساناتی با دینامیک ۲ تا ۴ روزه، مقیاس دو، نوساناتی با دینامیک ۴ تا ۸ روزه، مقیاس سه، نوساناتی با دینامیک ۸ تا ۱۶ روزه و … و مقیاس J، نوساناتی با دینامیک تا روزه را نشان می دهند، به طوری که پس از کسر نوسانات در J مقیاس مختلف از سری زمانی اصلی، سری به دست آمده، نوسانات سری زمانی مذکور را در دینامیکهای بالاتر از روزه نشان میدهد و در حقیقت نشان دهنده روند سری زمانی میباشد.
۳-۷: معیارهای ارزیابی عملکرد
در این تحقیق به بررسی پیش بینی شاخص قیمت بورس اوراق بهادار تهران با بهره گرفتن از روشهای مختلف پیش بینی میپردازیم. از این رو به منظور بررسی عملکرد مدلهای مزبور، بطور متداول از برخی معیارهای ارزیابی که بطور عمده مربوط به خطای بین خروجی پیش بینی شده و خروجی مطلوب واقعی است، استفاده میکنیم. در تحقیق حاضر از چهار معیار رایج ارزیابی عملکرد استفاده شده است: میانگین مربع خطا([۱۳۰]MSE) ، میانگین قدر مطلق درصد خطا([۱۳۱]MAPE)، ضریب تعیین(R2) و ضریب تعیین تعدیل شده.
Mean Squared Error (MSE) (۳-۲۰)
Mean Absolute Percentage Error (MAPE) (۳-۲۱)
R2 (۳-۲۲)
Adjusted R2 (۳-۲۳)
در بین چهار معیار ارزیابی عملکرد فوق دو معیار MSE و MAPE مربوط به میانگین خطای استاندارد است و هر چه مقدار آنها کمتر باشد به این معنا است که مدل، پیش بینی را با خطای کمتری انجام داده است در نتیجه کارائی مدل بیشتر خواهد بود. دو معیار ضریب تعیین(R2) و ضریب تعیین تعدیل شده همبستگی بین داده های واقعی و پیش بینی شده را بررسی می کند. مقدار R2 بین صفر و یک است و مقدار یک بیان کننده تطابق کامل داده هاست، در نتیجه هر چه مقدار R2 به یک نزدیک تر باشد، مطلوب تر خواهد بود.
۳-۸: خلاصه فصل
در این فصل به بحث روش تحقیق ، روش جمع آوری و تجزیه و تحلیل اطلاعات پرداخته شده است . در ابتدای فصل فرضیه ها و سپس روش تحقیق شامل قلمرو تحقیق ، جامعه و نمونه آماری تحقیق، روش و ابزار گردآوری اطلاعات و روش های مورد نیاز برای تجزیه و تحلیل اطلاعات و آزمون فرضیه ها بیان شده است و سپس مدل های مورد استفاده در تحقیق توضیح داده شده است. در نهایت معیارهای ارزیابی مدلهای تحقیق بیان گردید.
فصل چهارم
تجزیه و تحلیل داده ها
۴-۱: مقدمه
با توجه به مطالب بیان شده در فصول قبل و همچنین فرضیه های مطرح شده در فصل سوم در این فصل نتایج حاصل از تجزیه و تحلیل اطلاعات ارائه شده است. در این بخش ابتدا با طراحی و آمادهسازی مدلها، تخمین مدل ARIMA، همینطور آموزش و مدلسازی شبکهعصبی مصنوعی، استخراج قانون از شبکه عصبی با بهره گرفتن از الگوریتم ژنتیک و استفاده از تبدیل موجک برای ترکیب مدل های استفاده شده برای تخمین سری زمانی پرداخته و سپس بر اساس هر یک از روشها به پیشبینی شاخص قیمت برای ۴۲ روز آینده پرداخته میشود. همانطور که در فصل سوم اشاره گردید ابتدا کلیه متغیرهای تحقیق با بهره گرفتن از روش ساعتی نرما گردید.
۴-۲: آزمون فرضیه اول
همانطور که در فصل قبل اشاره گردید، در این مدل ابتدا باید مانایی سری بررسی گردد؛ برای اینکه سری مانا باشد باید قدر مطلق آماره دیکی فولر تعمیم یافته[۱۳۲] کمتر از سه آماره زیر آن باشد. در این پژوهش سری شاخص قیمت با یک مرحله تفاضل گیری شرایط لازم را اخذ و مانا گردید. سپس برای تعیین تعداد جملات خودرگرسیو (p)، و تعداد جملات میانگین متحرک (q)، با بهره گرفتن از توابع خودهمبستگی (AC) و خودهبستگی جزئی (PAC) از آماره های آکائیک و شوارتز استفاده میکنیم ، تعداد جملات خودرگرسیو و میانگین متحرک با آزمون و خطا بدست میآیند بطوریکه با اضافه نمودن مقادیرAR و MA باید به آماره های آکائیک یا شوارتز توجه نمود و در جایی که این مقادیر به حداقل رسید، در آنجا مدل بهینه میگردد. توجه داشته باشیم که در مرحله اضافه نمودن جملات خودرگرسیو و میانگین متحرک مقادیر آماره های Inverted AR Roots و Inverted MA Roots در قسمت پایانی بایستی کمتر از قدرمطلق یک باشد. با توجه به توضیحات بالا مدل ARIMA با یک مرحله تفاضلگیری مانا گردید و با تعداد جملات خود رگرسیو ۳ و تعداد جملات میانگین متحرک ۲، مدل فوق بهینه گردید. در شکل ۴-۱ پیش بینی صورت گرفته با بهره گرفتن از مدل (۳،۱،۲) ARIMAو داده های واقعی برای دوره پیش بینی مورد نظر مقایسه شده است:
شکل ۴-۱: مقایسه مقادیر واقعی و مقادیر پیش بینی شده توسط مدل ARIMA
MSE | MAPE | R2 | |
۰۰۸۸/۰ | ۰۰۷۵/۰ | ۹۳۳۳/۰ | ۹۲۶۳/۰ |
پس از تعیین مدل بهینه دقت پیش بینی و عملکرد مدل با بهره گرفتن از معیارهای ارزیابی عملکرد که در فصل قبل بیان شد مورد بررسی قرار گرفتند که نتیجه بررسی عملکرد آن در جدول ۴-۱ نشان داده شده است.
جدول۴-۱: نتایج ارزیابی عملکرد مدل ARIMA
نتایج، بیانگر عملکرد رضایت بخش مدل ARIMA در پیش بینی شاخص قیمت سهام در بورس اوراق بهادار تهران میباشد؛ لذا فرضیه اول تحقیق مبنی بر مطلوبیت مدل ARIMA در پیش بینی شاخص قیمت سهام تایید می شود.
۴-۳: آزمون فرضیه دوم
پیش بینی با بهره گرفتن از شبکه MLP به این صورت است که با انجام عمل آموزش و یادگیری بر روی شبکه، بهترین وزن خروجی که کمترین خطای پیش بینی را نتیجه دهد، انتخاب می شود. بنابراین آماده سازی داده ها برای یادگیری توسط شبکه یکی از مهمترین قسمت های کار با شبکه عصبی است. از این رو با توجه به مطالبی که در فصل قبل بیان شد، داده ها بین صفر و یک نرمال شدند و سپس در اختیار شبکه قرار داده شدند. از طرف دیگر به منظور سنجش ثبات وزن خروجی، داده ها به دو دسته تقسیم شدند؛ به این صورت که ابتدا یادگیری بر روی داده های آموزشی انجام شده و سپس وزن خروجی نهایی به منظور بررسی دقت پیش بینی شبکه، بر روی داده های آزمایشی، پیش بینی اعمال شد. از کل داده های مورد استفاده حدود %۹۷ به عنوان داده های آموزشی در نظر گرفته شدند و از مابقی آنها برای آزمایش شبکه استفاده گردید. در طی فرایند یادگیری، مرتباً میزان فراگیری شبکه توسط توابع هدف سنجیده شده و در نهایت شبکه ای مورد پذیرش قرار گرفت که دارای کمترین خطا باشد.
همانطوریکه در فصل قبل بیان شد، به منظور دستیابی به بهترین خطای پیش بینی در شبکه MLP ، باید آموزش داده ها با پارامتر های مختلف شبکه انجام گیرد تا به خطای بهینه دست پیدا کنیم. برای این منظور، در این تحقیق، با آموزش بیش از دویست الگوی مختلف به خطای قابل قبول رسیدیم. پارامترهای ساختار شبکه نهایی که منجر به خطای بهینه شده ، در جدول ۴-۲ نشان داده شده است.
جدول۴-۲. پارامترهای ساختار شبکه نهایی MLP
تابع فعال سازی | نرخ یادگیری | تعداد نرون های لایه پنهان | تعداد تکرار | شتاب[۱۳۳] شبکه |
غیرخطی سیگموئید | ۱/۰ | ۳ | ۹۰۰۰۰ | ۰۱/۰ |
به منظور بررسی دقت پیش بینی شبکه، از روش های ارزیابی عملکرد که در فصل سوم تشریح شد، استفاده کردیم که نتایج در جدول شماره ۴-۳ آورده شده است.
جدول۴-۳: نتایج ارزیابی عملکرد شبکه MLP
MSE | MAPE | R2 | R2 تعدیل شده | |
داده های آزمایشی | ۰۰۴۸/۰ | ۰۰۵۵/۰ | ۹۵۸۶/۰ | ۹۵۴۱/۰ |
داده های آموزشی | ۰۱۵۷/۰ | ۰۱۳۴/۰ | ۹۸۰۷/۰ | ۹۸۰۶/۰ |
در شکل ۴-۲ داده های واقعی با مقادیر پیش بینی شده توسط شبکه عصبی بهینه برای داده های آزمایشی مورد مقایسه قرار گرفته شده است:
شکل ۴-۲: مقایسه داده های واقعی با مقادیر پیش بینی شده توسط شبکه عصبی MLP
نتایج، بیانگر عملکرد رضایت بخش مدل شبکه عصبی (MLP) در پیش بینی شاخص قیمت سهام در بورس اوراق بهادار تهران میباشد؛ لذا فرضیه دوم تحقیق مبنی بر مطلوبیت مدل شبکه عصبی (MLP) در پیش بینی شاخص قیمت سهام تایید می شود، این مدل در مقایسه با مدل خطی ARIMA از دقت بالاتری در پیش بینی شاخص قیمت سهام برخوردار است. بنابراین فرضیه دوم پژوهش تایید میگردد.
۴-۴: آزمون فرضیه سوم
یکی از واژه هایی که به شبکه های عصبی نسبت داده می شود، جعبهی سیاه[۱۳۴] است. به این دلیل که ممکن است شبکه عصبی پیش بینی خوبی را انجام دهد ولی کاربران از چگونگی پیش بینی توسط شبکه های عصبی مطلع نیستند که این یکی از عیوب شبکه های عصبی به شمار می رود. از این رو یکی از تکنیک های حل این موضوع، استخراج قوانین از شبکه عصبی با الگوریتم ژنتیک است. در این تحقیق، پراکندگی زیاد داده ها، امکان استخراج قوانین عددی را با مشکل مواجه کرده است، از این رو باتوجه به قدرت قوانین فازی و ملموس بودن آنها، به منظور استخراج قانون با کمک الگوریتم ژنتیک و به منظور ورود و خروج داده ها از اصول و قوانین فازی استفاده شده است. بنابراین قدم اول معرفی توابع عضویت برای متغیرهاست که در این تحقیق از توابع عضویت مثلثی استفاده شده است. تابع عضویت مثلثی استفاده شده در این تحقیق دارای ۵ اندازه کوچک(S)، متوسط کوچک(MS)، متوسط(M)، متوسط بزرگ(ML) و بزرگ(L) می باشد که در شکل های زیر نشان داده شده است:
شکل ۴-۳: تابع عضویت متغیر شاخص قیمت شکل۴-۴: تابع عضویت متغیر شاخص S&P500
شکل ۴-۵: تابع عضویت متغیر قیمت طلا شکل۴-۶: تابع عضویت متغیر ارز دولتی
شکل ۴-۷: تابع عضویت متغیر قیمت سبد نفتی ایران
مرحله بعد یادگیری الگوریتم ژنتیک به منظور استخراج مجموعه قوانین است. اما شرط لازم آن معرفی تابع برازندگی است تا شروع به یادگیری الگوریتم ژنتیک نموده و بتوانیم به قوانین خوب دست یابیم. در این تحقیق تابع برازندگی، کمترین فاصله بین خروجی تخمین زده شده توسط الگوریتم ژنتیک و خروجی شبکه MLP است که به عنوان قوانین مناسب انتخاب می شود.
در الگوریتم ژنتیک نیز برای آموزش و یادگیری الگوریتم ژنتیک، پارامترهای متفاوتی وجود دارد که اندازه های آن به صورت آزمون و خطا انتخاب می شوند تا به قوانین مناسبی دست یافته شود. پس از یادگیری با اندازه های زیادی از این پارامتر ها، در نهایت الگوریتم ژنتیک با پارامترهای زیر به عنوان مدل نهایی انتخاب شد.
جدول۴-۴: پارامتر های الگوریتم ژنتیک مورد استفاده
جمعیت کروموزومی[۱۳۵] | تکرار | اندازه کروموزوم | احتمال ادغام[۱۳۶] | احتمال جهش[۱۳۷] | اندازه تابع عضویت |
۱۵۰ | ۳۵۰ | ۵ | ۵/۰ | ۷/۰ | ۵ |
پس از دستیابی به اندازه های مناسب پارامترها و آموزش الگوریتم ژنتیک و با در نظر گرفتن تابع برازندگی تعریف شده، مجموعه ای از قوانین به صورت زیر از شبکه عصبی MLP استخراج شده است.
جدول۴-۵: مجموعه قوانین استخراج شده از شبکه عصبی
If X1 is ML and X2 is MS and X3 is M and X4 is M then Y is L |
If X1 is ML and X2 is MS and X3 is L and X4 is L then Y is L |
If X1 is L and X2 is ML and X3 is M and X4 is M then Y is ML |
If X1 is L and X2 is L and X3 is ML and X4 is ML then Y is ML |
If X1 is M and X2 is MS and X3 is ML and X4 is ML then Y is M |
If X1 is ML and X2 is M and X3 is ML and X4 is ML then Y is M |
S=SMALL, MS=MEDIUM SMALL, M=MEDIUM, ML=MEDIUM LARGE, L=LARGE
پس از استخراج مجموعه قوانین، به منظور بررسی عملکرد و دقت پیش بینی الگوریتم، به پیش بینی شاخص قیمت سهام بورس اوراق بهادار تهران با تکیه بر داده های آزمایشی پرداختیم. با بهره گرفتن از توابع عضویت تعریف شده و قوانین فوق، شاخص قیمت برای ۴۲ روز تخمین زده شد. دقت پیش بینی و عملکرد قوانین استخراج شده با بهره گرفتن از معیارهای ارزیابی عملکرد که در فصل قبل بیان شد مورد بررسی قرار گرفتند که نتیجه بررسی عملکرد آن در جدول ۴-۶ نشان داده شده است.
جدول۴-۶: نتایج ارزیابی عملکرد الگوریتم استخراج قانون
MSE | MAPE | R2 | R2 تعدیل شده | |
داده های آزمایشی | ۰۰۴۲/۰ | ۰۰۵۰/۰ | ۹۶۷۳/۰ | ۹۶۵۶/۰ |
داده های آموزشی | ۰۰۲۷/۰ | ۰۰۳۱/۰ | ۹۹۸۲/۰ | ۹۹۸۱/۰ |
در شکل ۴-۸ داده های واقعی با مقادیر پیش بینی شده توسط الگوریتم استخراج قانون (سیستم ژنتیک فازی) برای داده های آزمایشی مورد مقایسه قرار گرفته شده است:
شکل ۴-۸: مقایسه داده های واقعی با مقادیر پیش بینی شده توسط الگوریتم استخراج قانون(سیستم ژنتیک فازی)
نتایج، بیانگر عملکرد خوب مدل الگوریتم استخراج قانون در پیش بینی شاخص قیمت سهام در بورس اوراق بهادار تهران میباشد؛ با توجه به جدول ۴-۶ و ۴-۳ الگوریتم استخراج قانون از شبکه عصبی مصنوعی (MLP) در تمامی معیارهای ارزیابی عملکرد دارای نتایج بهتری میباشد، لذا فرضیه سوم پژوهش که بیانگر نتایج مطلوب الگوریتم استخراج قانون از شبکه عصبی مصنوعی میباشد، تایید می شود، این مدل در مقایسه با شبکه عصبی مصنوعی از دقت بالاتری در پیش بینی شاخص قیمت سهام بورس اوراق بهادار تهران برخوردار است.
۴-۵: آزمون فرضیه چهارم
در مرحله نخست با بهره گرفتن از موجک (دبوچی)، سری زمانی تا سه مرحله تجزیه میشود، تا سطح هموارشده تقریبا بصورت یک خط نسبتاً راست درآید و با در نظرگرفتن این نکته که مدلARIMA در پیشبینی سری های خطی قدرت بالایی دارد، این سری بوسیله آن پیشبینی میشود. در مرحله بعد با جمع کردن توابع جزئیات(مولفهها) یک سری بدست میآید که روند زدایی شده است و فقط شامل نوسانات در طول دوره است. از آنجایی که: (صادقی و همکاران،۱۳۸۸)
سری اصلی= سری سطح هموار شده + مجموع سریهای توابع جزئیات
در مرحله بعد عوامل تاثیرگذار بر این نوسانات تعیین میشود. عوامل تاثیرگذار بر این نوسانات به عنوان ورودی به شبکه عصبی داده و نوسانات بهعنوان خروجی آن تعیین میشود و در شبکه عصبی به طراحی و تخمین مدل در این زمینه پرداخته میشود. در انتها با بهره گرفتن از معکوس تبدیل موجک گرفته شده پیش بینی های صورت گرفته با مدلهای شبکه عصبی (MLP) و مدل خطی ARIMA با هم ترکیب شده تا پیش بینی سری اصلی حاصل گردد.
در مدل ARIMA همانطور که اشاره گردید ابتدا باید مانایی سری بررسی شود و سپس تعداد جملات خودرگرسیو و تعداد جملات میانگین متحرک بدست آید، در اینجا سری هموار شده با یک مرحله نفاضل گیری مانا شده و سپس برای تعیین تعداد جملات خودرگرسیو و میانگین متحرک همانطور که اشاره گردید از آماره آکائیک و شوارتز استفاده میکنیم، پس از آزمون و خطا تعداد جملات خودرگرسیو و میانگین متحرک به ترتیب ۲و ۲ بدست آمد، لذا مدل بهینه بصورت (۲،۱،۲) ARIMA تعیین شد.
برای اینکه مدلهای استفاده شده قابلیت مقایسه داشته باشند، شبکه عصبی استفاده شده دارای ویژگیهای یکسان همانند شبکه عصبی قبلی میباشد و سپس برای تعیین پارامترهای مناسب شبکه عصبی از آزمون خطا استفاده میکنیم در جدول۴-۷ پارامترهای شبکه عصبی بهینه آورده شده است.
جدول۴-۷: پارامترهای ساختار شبکه نهایی MLP