در این مقاله ، من قصد دارم نگاهی اجمالی به یک مدل دارایی برای تجارت الگوریتمی ارائه دهم. این مدل از جهان باید به ما این امکان را بدهد که بر اساس اتفاقی که در گذشته رخ داده است ، پیش بینی کنیم و با تجارت این اطلاعات درآمد کسب کنیم. مدل و استراتژی تجارت نمونه ای از اسباب بازی ها است ، اما من بخش علوم داده را از کد ارائه می دهم ، تا بتوانید یک حس واقعی از ملموس بودن این کار مدل سازی را بدست آورید.
من چند ماه پیش نوشتن کد این مقاله را شروع کردم و اکنون آن را به همراه خبرهایی که مجوز SEC خود را برای Investifai دریافت کرده ایم ، ارسال می کنم!
از زمان ارائه Investifai. com من در TMLS در سپتامبر 2018 ، من در مورد داده های اختصاصی ما سؤال کرده ام و صادقانه بگویم ، من صحبت نمی کنم. این نکته حائز اهمیت است که فقط با داده های "استاندارد" بازار از بلومبرگ و تامپسون رویترز ، شما در برابر کل دنیای FinTech قرار دارید ، که برای دسترسی به همان داده ها پرداخت می کند. و بنابراین ، منابع داده جدید به شما پیش بینی می کند که پیش بینی هایی را انجام دهید که سایر شرکت کنندگان در بازار ممکن است داده ها را نداشته باشند.
در این مقاله ، من قصد دارم به شما نشان دهم که چگونه داده های اقتصادی را شناسایی کرده و آن را با یک دارایی قابل تجارت مطابقت دهید. ما داده ها را دریافت خواهیم کرد ، آن را تمیز می کنیم ، آن را بازجویی می کنیم و آن را در یک مدل ساده تنظیم می کنیم.
"همه مدل ها اشتباه هستند اما برخی از آنها مفید هستند"
دارایی ما برای این تمرین اسباب بازی ، جفت ارز USD/CAD است. ما می توانیم داده های تاریخی روزانه را برای بازگشت دارایی به دهه 1950 از داده های باز کانادا در اینجا بدست آوریم.
کد زیر آن داده ها را پاک می کند و آن را به یک قالب قابل استفاده تبدیل می کند.
در اینجا داده های USD/CAD در یک نمودار از fxtop. com آورده شده است:
و در اینجا داده هایی که ما از مجموعه داده های باز کانادا استخراج کردیم:
داده ها در هر دو نمودار در همان مکان ها قرار می گیرند و با چند بررسی نقطه دیگر ، ما اطمینان داریم که این داده هایی است که فکر می کنیم وجود دارد.
تا کنون ، ما دیده ایم که برای تهیه داده ها در یک قالب خوب ، تمیز کردن بسیار کمی تمیز است. این داستان در علوم داده است: بیشتر کارها در مورد دستکاری داده ها در قالب مورد نیاز برای مشاهده همبستگی ها و سپس پیش بینی است.
اکنون حرکت می کنیم تا برخی از داده هایی را که فکر می کنیم به ما کمک می کند تا حرکت دارایی USD/CAD را پیش بینی کنیم. این داده ها همچنین از داده های باز کانادا ، در قالب شاخص قیمت محصولات صنعتی (IPPI) حاصل می شود که باید مربوط به نحوه کرایه ارز کانادا نسبت به ارز ایالات متحده باشد. اگر مسائل هزینه بیشتری داشته باشد ، شاید این چیزی در مورد اقتصاد و ارز (نسبت به ایالات متحده) به ما بگوید. اطلاعات بسیار بیشتری وجود دارد که می توانم از این داده ها و نحوه جمع آوری و محاسبه آن استفاده کنم. اکنون روی صندلی خود نگه دارید. اینجا می رویم ...
مجموعه داده کامل (سمت چپ) به نظر راست می رسد. نگاهی دقیق تر به یک دهه (درست) نیز منطقی به نظر می رسد. ما می بینیم که همه سیگنال ها در همان نقاط زمان شروع یا پایان نمی یابند.
دو شکل فوق شیرجه اولیه ما به داده های اقتصادی برای مدل ما است. ما از راهنمای داده می دانیم که این شاخص IPPI "فهرست ، 2010 = 100" را می چسباند و می توانیم ببینیم که PEG به وضوح در داده های بلند مدت (سمت چپ) از دهه 1950 تا 2019. همه چیز در سال 2010 = 100 همگرا می شود و سپس گسترش می یابداز آنجا.
همچنین مقدار کمی عجیب و غریب برای سیگنال های خاص در داده ها وجود دارد. شکل زیر نمودار عادی شده برای فاکتور IPPI به نام "لوازم اداری کاغذ" از سال 2008 تا 2016 را نشان می دهد. بیشتر سیگنال ها این مشکل را ندارند ، اما باید در نظر داشته باشید که مجموعه داده کامل نیست.
استفاده از این مجموعه داده محدودیت های جدی دارد. اول از همه، فقط ماهانه در دسترس است. این برای یک الگوریتم معاملاتی واقعی بسیار کند است. دوم، عوامل این شاخص همه چیزهایی در مورد کانادا هستند، که در مورد تجارت USD/CAD، نیمی از داستان یا کمتر است. سوم، ما دادههای اخبار یا سایر منابع داده را درج نمیکنیم. همه اینها خوب است، زیرا ما فقط نشان می دهیم که در اصل چگونه کار می کند. در واقع، راههای زیادی برای استفاده از دادههای کلان ماهانه در معاملات روزانه و ادغام ورودیهای بسیاری از انواع دادهها در یک مدل وجود دارد. با در نظر گرفتن این اخطارها، در اینجا نحوه استخراج داده های IPPI در قالب قابل استفاده برای مدل خود آمده است:
یک مدل یادگیری ماشینی دارای برخی مشاهدات ورودی "x" و برخی پیش بینی های خروجی "y" است که در آن مدل تابعی است که اتصال y=f(x) را ایجاد می کند. مدل "f" از مشاهدات تا پیش بینی ها نگاشت می شود. در مورد ما، "x" داده IPPI است، و ما می خواهیم از آن برای پیش بینی تغییرات قیمت در USD_CAD، که خروجی "y" ما است استفاده کنیم. قبل از اینکه بتوانیم پیشبینی کنیم، باید همبستگیهای بین IPPI و USD_CAD را بررسی کنیم تا تأیید کنیم که این موارد واقعاً همانطور که فرض کردیم به یکدیگر مرتبط هستند. ما همچنین به فراتر از همبستگی ها نگاه خواهیم کرد تا ببینیم چه همبستگی هایی در مقادیر آینده USD_CAD بر اساس مقادیر گذشته در داده های IPPI می بینیم. به عبارت دیگر، ما به دنبال نشانه هایی خواهیم بود که سیگنال هایی در IPPI وجود دارد که می توانیم از آنها برای پیش بینی USD_CAD استفاده کنیم.
بیایید با پیوستن به داده های اقتصادی با داده های دارایی شروع کنیم تا چیزهای جالبی را مشاهده کنیم. کد همه علوم داده زیر در اینجا یافت می شود:
نگاهی "تصویر بزرگ" به داده ها: دهه 1950 تا کنون
پس از پیش پردازش، 931 عامل در مجموعه داده باقی می ماند. بیایید ابتدا نگاهی به عواملی بیندازیم که به طور قوی با USD_CAD در طول کل مدت داده ها (دهه 1950 تا کنون) همبستگی دارند.
در این نمودار اول، مجموعه ای از همبستگی های جالب را می بینیم. به عنوان مثال، چوب و محصولات تصفیه شده مرتبط مانند کاغذ روزنامه و خمیر کاغذ و کاغذ با قدرت دلار آمریکا مرتبط هستند. این منطقی است. کاغذ گران از کانادا منجر به تقاضای کمتری میشود، و معروف است که کانادا و ایالات متحده بر سر قیمتگذاری الوار چوب نرم اختلافی بیپایان دارند. این به ما می گوید که الوار ارزان از کانادا بر USD_CAD فشار می آورد.
در مرحله بعد، بیایید ببینیم چه عواملی با USD_CAD ضعیفتر مرتبط هستند. در نمودار زیر میتوانیم ببینیم که بخش نفت و گاز، مانند بخش معدن و معدن، نقش بزرگی را ایفا میکند. این منطقی است. کانادا سنگ معدن (به عنوان مثال نیکل در سادبری) تولید می کند و همچنین نفت (مثلا قیر آلبرتا) صادر می کند، بنابراین منطقی است که افزایش قیمت آنها با کاهش USD_CAD مرتبط است.
در اینجا یک نمای کوچکنمایی از هر عامل IPPI و همبستگی آن با USD_CAD آمده است:
اینها برخی از همبستگی های خوب هستند، اما همبستگی با پیش بینی معاملات یکسان نیست. ما باید با استفاده از علیت، نه همبستگی، پول دربیاوریم. و بنابراین ما به نوعی داده بازده مورد انتظار بر اساس مشاهدات همبستگی خود نیاز داریم.
شکل زیر همبستگی بین فاکتورهای IPPI و تغییر ارزش USD_CAD را طی ماه بعد نشان می دهد. یک هشدار این است که داده های نظرسنجی ممکن است حتی یک ماه بعد در دسترس نباشد، اما بیایید وانمود کنیم که می توانیم به این دسترسی به موقع به داده ها دست پیدا کنیم.
رابطه بلندمدت کلی USD_CAD با شاخص قیمت محصولات صنعتی مانند رابطه در هر دهه نیست. این ایده خوبی است که ما به دادهها عمیقتر برویم تا به ما کمک کند تا بفهمیم رابطه بین فاکتورهای IPPI و حرکت USD_CAD چیست. در بخشهای بعدی این مقاله، این دادهها را بر اساس هر دهه برای دهههای 1990، 2000 و 2010 بررسی خواهیم کرد.
دهه 1990 - یک گاو نر برای USD_CAD
بیایید ابتدا مواردی را در دهه 90 بررسی کنیم که بیشترین ارتباط را با قدرت دلار داشت. ما برخی از مظنونین معمولی مانند خودروها و محصولات کاغذی را می بینیم (همانطور که در بالا ذکر شد، قیمت های بالاتر برای CAD بد هستند). دیدن IPPI نزدیک به بالای لیست جالب است، که نشان می دهد به طور کلی قیمت های بالاتر محصولات صنعتی در کانادا به معنای دلار قوی تر است.
دلار در این بازه زمانی از بین رفت، و بنابراین بیشتر همه چیز افزایش قیمت با تسلط ایالات متحده مرتبط بود. در اینجا نمودار قیمت از بالا فشرده شده است تا فقط دهه 1990 را ببینید:
همانطور که در نمودار زیر می بینیم، تنها چند عامل IPPI در دهه 1990 با USD_CAD همبستگی منفی داشتند. خمیر چوب برای دیدن با همبستگی منفی عجیب است، زیرا بیشتر عوامل مرتبط با چوب با همبستگی مثبت ختم میشوند.
برای ثبات، بیایید به نمودار همبستگی برای این دوره زمانی نگاه کنیم.
مانند قبل، ما بیشتر به سیگنالهای معاملاتی اهمیت میدهیم تا همبستگیهای خام، و بنابراین نمودار زیر نشان میدهد که چگونه هر عامل IPPI با تغییر از USD_CAD ماه جاری به USD_CAD ماه بعد (تغییر نرخ) مرتبط است.
توجه داشته باشید که اگرچه بیشتر عوامل با USD_CAD همبستگی مثبت داشتند، اما تعداد زیادی با تغییر USD_CAD همبستگی مثبت نداشتند. همچنین، توجه داشته باشید که بسیاری از همبستگی ها برای چیزهایی که در دهه 1990 هیچ داده ای وجود نداشت، از نتایج پنهان است. در بخش قبلی که تمام دادهها را بررسی میکنیم، هر عاملی که دادهای در هر نقطهای داشته باشد، میتواند مرتبط باشد. اکنون که ما به زیرمجموعه کوچکتری از داده ها نگاه می کنیم، فقط می توانیم در مورد عواملی که در دهه 1990 داده هایی برای آنها وجود داشت چیزهایی بگوییم.
در اینجا نگاهی اجمالی به شکل ظاهری چارچوب داده است تا نشان دهد که بسیاری از عوامل در اوایل مجموعه داده در دسترس نیستند:
بیایید اکنون به بررسی دادههایی بپردازیم که مدل ما را با استفاده از لنزهای دهه 2000 پایهگذاری میکنند.
دهه 2000 - جهانی در حال تغییر
بیایید به عقب برگردیم و همانطور که برای دهه 1990 و برای مجموعه داده کامل انجام دادیم، به همبستگی های مثبت و منفی در داده ها نگاه کنیم.
در دهه 2000، ما همچنان شاهد ارتباط قوی بین استحکام USD_CAD و وسایل خودرو، و همچنین مواد مرتبط با چوب/کاغذ بودیم.
در همبستگی های منفی زیر می بینیم که فلزات و نفت همچنان بخشی از داستان ضعف USD_CAD هستند.
پس چه چیزی تغییر کرد؟این تغییر در این نمای بزرگنمایی ظریف است، اما اساساً افزایش دهه 1990 در USD_CAD دوام نیاورد. در اینجا نمای کوچکنمایی از همبستگیهای بین فاکتورهای IPPI و USD_CAD، با دهه 1990 در سمت راست و دهه 2000 در سمت چپ وجود دارد.
ما شاهد یک برگشت بسیار چشمگیر از عوامل مرتبط با USD_CAD به عواملی هستیم که با USD_CAD همبستگی منفی دارند. این به ما نشان می دهد که استفاده از این عوامل از دهه 1950 تاکنون به عنوان داده های آموزشی برای مدل پیش بینی ما اشتباه خواهد بود. استفاده از همه داده ها، تغییرات رژیم در نحوه اعمال این عوامل در زندگی واقعی را نادیده می گیرد. با این حال، میتوانیم با یک پنجره کشویی که از چیزهای جدید یاد میگیرد و چیزهای قدیمی را حذف میکند، بک تست کنیم. این یک تاکتیک بسیار متداول برای آزمایش استراتژیها در گذشته است.
و اکنون، برای ثبات، به نموداری نگاه می کنیم که نشان می دهد چگونه عوامل مختلف با تغییرات USD_CAD پس از یک ماه ارتباط دارند.
این یک وضعیت کاملاً یکنواخت است، با بسیاری از همبستگی های مثبت و منفی که در داده ها نشان داده می شود. این نشانه خوبی برای تلاش برای پیش بینی حرکت USD_CAD در این دوره است. در حقیقت، جهت همبستگی ها به اندازه قدرت مهم نیست، و اینکه سیگنال ها چقدر مستقل از یکدیگر هستند. در نهایت عامل کلیدی این است که چقدر پول در می آوریم. ایده در اینجا این است که CAD و USD را نگه داریم و هر ماه بر اساس زمانی که مدل ما پیش بینی می کند باید بین آنها جابه جا شود.
دهه 2010 - طولانی ترین رشد اقتصادی تا کنون
کنجکاو بودم ببینم داستان با سیگنال های همبستگی بالا در داده ها چیست. همبستگی چگونه به نظر می رسد؟خوب، نگاهی به قیمت ماشین های برفی و USD_CAD در نمودار زیر بیندازید.
همبستگی فوق العاده بالا بین USD_CAD و قیمت خودروهای برفی در دروازه کارخانه. فقط با نگاه کردن می توانید آن را ببینید.
این ارتباط بین قیمت ماشین های برفی در دروازه کارخانه و قدرت دلار یک داستان واقعاً کانادایی است. هر چه خرید ماشین های برفی هزینه بیشتری داشته باشد، قدرت یک دلار کانادا در ایالات متحده آمریکا کمتر است. جالب هست. احتمالاً یک عامل زمینهای دیگر مانند قیمت نفت و فلزات است که این پویایی را ایجاد میکند، اما هنوز هم خوب است که به برخی از دادهها نگاهی بیندازیم تا صحت منطقی بودن آن را تأیید کنیم.
به نظر می رسد که در دهه 2010 همبستگی های بسیار قوی بین برخی از عوامل IPPI و USD_CAD وجود داشته است. ما همچنان شاهد چیزهای خودرویی مانند SUV ها و همچنین موارد جنگی هستیم که نقش مهمی در افزایش قدرت دلار دارند. من فکر می کنم یک پیام اساسی در مورد حمله 11 سپتامبر 2001 و جنگ های ناشی از آن وجود دارد که دلار را هم به عنوان یک پناهگاه امن و هم به عنوان یک قدرت نظامی تقویت می کند. من فکر می کنم که این امر در دهه 2010 سرچشمه گرفت. این همبستگی ها داستان چوب را از نتایج برتر خارج کرد. اگرچه این اختلاف هنوز حل نشده است، بسیاری از کارخانه های خمیر و کاغذ در کانادا به سادگی در دهه 2010 تعطیل شدند.
در نمودار زیر می بینیم که نفت و محصولات مرتبط و همچنین فلزات همچنان بخشی از همبستگی های منفی برای USD_CAD هستند.
در طول دهه 2010 عوامل بسیار بیشتری در مجموعه داده موجود بود. نمودار زیر توزیع همبستگی USD_CAD را در بین این عوامل نشان می دهد.
حال بیایید نگاهی بیندازیم که چگونه می توان از این عوامل متعدد برای پیش بینی استفاده کرد.
برخلاف دهه 1990، به نظر می رسد که بین توزیع های همبستگی و پیش بینی مطابقت وجود دارد. به خاطر داشته باشید که ترتیب عوامل در این نمودارها یکسان نیست، و بنابراین این داده ها به ما نمی گویند که آیا عواملی که با USD_CAD مرتبط هستند نیز تغییرات USD_CAD را پیش بینی می کنند.
خلاصه ای سریع و به سمت تولید مدل
ما دیدیم که مجموعه داده کلی دارای اطلاعات بیشتری از این دهه نسبت به دهههای گذشته است و دادههای دهههای قبل احتمالاً به امروز ما مربوط نیست. برخی از نقاط کلیدی در زمان وجود دارد که در آن داستان اساسی در داده ها تغییر می کند، و ما نمی توانیم از داده های قبل از آن زمان برای پیش بینی دوره بعد از آن استفاده کنیم.
همبستگی بین داده های اقتصادی و داده های دارایی بسته به دوره زمانی مشاهده شده و سیگنال های موجود در طول دوره زمانی مورد نظر متفاوت است. پایین سمت چپ مربوط به دهه 1990 است. بالا سمت چپ مربوط به دهه 2010 است. بالا سمت راست مربوط به دهه 1990 است. پایین سمت راست برای مجموعه داده کامل است.
ما همچنین دیدیم که داده ها با توجه به انتظارات ما در مورد جهان منطقی است. یک مدل مبتنی بر این داده ها باید نسبتاً قابل تفسیر باشد. به عنوان مثال ، اگر چند عامل به افزایش USD_CAD اشاره کنیم ، باید بتوانیم ببینیم این عوامل چیست و اعتبار می دهیم که این موقعیت طولانی یا کوتاه معقول است.
در این مرحله ، من می خواهم به مقاله خود در مورد بسیاری از مواردی که هنگام تنظیم یک استراتژی معاملاتی نباید انجام دهید ، مراجعه کنم. این مطالب را در ذهن داشته باشید که ما به ساخت یک مدل می پردازیم. این یک نمونه اسباب بازی است ، و شما اکنون کد را برای نحوه تکرار علم داده در پشت این کار ، از جمله مجموعه داده ها دارید. من شما را تشویق می کنم که با آن بازی کنید و ببینید که با چه چیزی می توانید همراه باشید.
مدل معاملات الگوریتمی پیش بینی کننده
برای ساختن مدل پیش بینی کننده خود ، باید همانطور که در بالا بحث کردیم ، تنسورها را "X" و "Y" تنظیم کنیم. ورودی "X" نسخه تمیز شده دیگری از داده های IPPI خواهد بود و "Y" ما یکی از 2 دسته خواهد بود: طولانی و کوتاه. چیزهای جالب مانند آستانه برای تصمیم گیری در مورد تغییر پیش بینی شده در USD_CAD ، یک عمل فراتر از محدوده این نمونه اسباب بازی است. من یک مدل یادگیری عمیق به جلو (یک DNN) را مانند یک AutoEncoder انتخاب کردم ، با برخی از سر و صدای در ورودی اضافه می شود تا به جلوگیری از بیش از حد کمک کند.
برای پیش بینی ها ، ما به 3 ماه گذشته شاخص های مقیاس IPPI نگاه می کنیم.
برای پیش بینی ، ما فقط از شاخص هایی استفاده می کنیم که حداقل 10 ٪ همبستگی با بازده مورد انتظار از USD_CAD داشتند. این باعث کاهش تعداد ابعاد در "x" می شود. علاوه بر این ، در حین آزمایش ، ما از Scaler آموزش دیده از تمرین استفاده می کنیم ، زیرا ما از قبل نمی دانستیم که چگونه می توانیم چیزهایی را که هنوز اتفاق نمی افتد مقیاس کنیم. بیایید هزینه ها را در 0. 20 امتیاز پایه در هر تجارت تعیین کنیم (همانطور که در IB ذکر شده است). هر مدل اجرا یک نمونه جدید آموزش و آزمایش برای مدل (از ابتدا) است.
بیایید از سال 2000 تا ابتدای سال 2012 ، داده ها را آموزش دهیم و سپس "تجارت" را در سال 2012 تا پایان Q1 2017 انجام دهیم. این 12 سال از داده های آموزش ماهانه ، یا 12*12 = 144 DataPoints است. در حقیقت ، پس از برش دادن یک نان ، 143 نمونه آموزشی دریافت می کنیم که هر کدام 39 نقطه داده است. وقتی این کمبود نمونه داده ها وجود دارد ، من دوست دارم آنها را به عنوان مجموعه ای از معادلات که برای آنها یک راه حل تقریبی را شناسایی می کنیم ، فکر کنم. این عالی نخواهد بود ، اما ما می دانیم که آیا وقتی می بینیم که مدل ما را درآمد کسب می کند ، کار می کند.
قبل از تنظیم: عملکرد مدل برای 10 شبیه سازی قبل از تنظیم شبکه و ماساژ داده های آموزش اجرا می شود. نتایج کاملاً تصادفی است.
پس از تلاش ، اما قبل از هزینه ها: عملکرد مدل برای 10 شبیه سازی اجرا می شود. این شبیه سازی ها شامل هزینه ها نبودند. نتایج امیدوار کننده به نظر می رسد.
یک الگوریتم معاملاتی متولد می شود: این نتایج با هزینه های موجود است. ما کمی درآمد کمتری کسب می کنیم ، اما عملکرد کمی سازگارتر داریم. هزینه ها فقط در هنگام خرید یا تغییر موقعیت پرداخت می شود. در نهایت 9 از 10 شبیه سازی به سود پایان یافت.
در نقطهای که من در اطراف خود آشفتگی را متوقف کردم (به بالا مراجعه کنید) ، این مدل بین دویدن قوام ایجاد کرده است. با این حال ، در طول 3 سال اول شبیه سازی ، همه مدل ها پول خود را از دست دادند. این یک مشکل است ، و من فقط می خواهم آن را ترک کنم ، زیرا این یک مشکل اسباب بازی است. میانگین ارزش نهایی در طول شبیه سازی ها بین 118. 7 بین 2012-01-01 و 2017-03-01 بود. این مبلغ 5. 25 سال تجارت است. بنابراین نرخ بازده سالانه 3. 32 ٪ بود. نه آن عالی ، اما نه 0 یا منفی. من نمی خواهم به این موضوع بپردازم که چگونه می توانیم با اهرم یا تجزیه و تحلیل بازده تنظیم شده ریسک ، بازده را رشد دهیم. دقت آموزش به طور مداوم در محدوده 80 ٪ بود ، در حالی که دقت آزمون عمدتا بالاتر از 50 ٪ بود که در جدول زیر گزارش شده است.
ما می توانیم ببینیم که صحت آموزش نکته خوبی نبود که آخرین مدل (شماره 9) الگوی خوبی نبود. هوشمندانه ترین رویکرد برای به حداکثر رساندن سود در اینجا ، جمع آوری مدل ها در کنار هم و میانگین این نوع خطا است. تصور کنید که 10 دلار به جای 100 دلار به دست فقط یک نمونه مدل در دست 10 مدل قرار دهید.
طولانی رفتن برای دوره شبیه سازی کامل موارد زیر را نشان می دهد:
با روکش این استراتژی های فعال و غیرفعال ، نمودار زیر را دریافت می کنیم.
ما می بینیم که برگزاری USD_CAD عالی خواهد بود. متأسفانه ، ما از قبل نمی دانستیم که خرید و نگه داشتن USD_CAD بدون توصیه برخی از مدلی که به ما می گوید چه کاری باید انجام دهیم ، سودآور است. برخلاف بازارهای سهام ، جایی که یک استراتژی بلند مدت واقعی خرید و نگه داشتن است ، جفت ارز از این منطق پیروی نمی کنند. در عوض ، جفت ارز فیات با افزایش و سقوط اقتصادها و دولت های مرتبط تغییر می کند.
چه عواملی باعث پیش بینی شده است؟(با استفاده از ابزارهای خوب نشان داده شده است)
جالب است که ما مدلی داریم که درآمد کسب می کند ، اما بسیار خوب است که درک بهتری از آنچه انجام می دهد بدست آوریم. من برای دریافت آن تصویر از DeepShap استفاده کردم. اول ، من یک انتظار قبلی (پس زمینه) را با استفاده از 75 نمونه از x_train تنظیم کردم. از بقیه X_Train برای دریافت مقادیر Shap استفاده شده در مرحله بعدی استفاده شد. نمودار زیر طرح خلاصه داده های X_Test را با استفاده از مقادیر Shap به دست آمده در مرحله آخر نشان می دهد.
سهم نسبی هر یک از عوامل در مدل کوچک ما. در صورتی که از ماه قبل از پیش بینی باشد ، هر عامل قبل از M1 پیش می رود ، یا اگر از 2 ماه قبل از پیش بینی باشد ، M2.
بلافاصله می توانیم ببینیم که این مدل کاری را انجام نمی دهد که فکر می کردیم. این بیشترین اهمیت را در مورد لباس های مردان (منسوجات) ، مرغ ، محصولات تمیز کننده ، دخانیات و مواد آرایشی اهمیت می دهد. اینها همه عواملی است که ما در همه تجزیه و تحلیل فوق به فکر زیاد نبودیم. چیز خوبی که نگاه کردیماکنون ، با یک قدم عقب ، می بینیم که مواد مبتنی بر روغن مانند آسفالت و سوخت جت در اینجا قرار دارند که نشانه خوبی است که ما کاملاً برای ناهار نیستیم. و ما چیزهای مرتبط با کاغذ را نیز می بینیم ، مانند Newsprint ، که نشانه خوبی است که چیزهایی را که انتظار داشتیم ببینیم هنوز در آنجا است. آنچه ما از این تحلیل آموخته ایم این است که چیزهایی که فکر می کنید مهم است ممکن است مهمترین عوامل نباشد. در این حالت ، معلوم شد که چیزهایی که ما در مورد آنها فکر می کردیم در لیست است ، اما تأثیر کمتری بر پیش بینی ها نسبت به سایر عوامل موجود در مدل دارد.
سرانجام ، محدودیت های بیشتری از رویکرد ارائه شده در این مقاله وجود دارد که قابل ذکر است. بهتر است از یک انبار داده از این روش دستی استفاده کنید و بهتر است از یک چارچوب پشتی نیز استفاده کنید. من سعی کردم این مقاله را تا حد ممکن خود نگه دارم ، بدون مراجعه به کد اختصاصی.
از اینجا به کجا
Investifai. com بالاخره SEC دارد، و بنابراین ما اکنون میتوانیم داراییها را بپذیریم!دفتر در دبی شلوغ از هیجان است، زیرا ما در رابط کاربری و فرآیند KYC کارهای نهایی را انجام می دهیم. اگر یک سرمایه گذار واجد شرایط هستید و به دنبال سرمایه گذاری در صندوق اولیه هستید، لطفا با hello@investifai. com تماس بگیرید.
در اینجا در کانادا، محصول حسابرسی داخلی ما AuditMap. ai همچنان به بلوغ خود ادامه می دهد، زیرا ما در حال ورود به مشتری هستیم. بیشتر در مورد آن چیزها در اینجا.
اگر این مقاله در مورد علم داده در توسعه مدل معاملاتی الگوریتمی را دوست داشتید، پس نگاهی به برخی از پرخواننده ترین مقالات گذشته من بیندازید، مانند «چگونه یک پروژه هوش مصنوعی را قیمت گذاری کنیم» و «چگونه یک مشاور هوش مصنوعی استخدام کنیم».