

التنبؤ بالبيانات
R تعد لغة
من اللغات التي صعد نجمها حديثا وبشكل سريع بمجال البرمجة
العلمية في قطاعي الإحصاء والمعلومات الحيوية
حيث باتت معتمدة على نطاق واسع في كثير من الجامعات ومراكز البحث العلمية، وأصبحنا نرى استخدامها والإشارة إليها في المقالات المنشورة بالمجلات العلمية المحكّمة يزداد بشكل طردي ومتسارع , هذا عدى عن حقيقة كونها لغة حرة مفتوحة المصدر .

قراءة البيانات من الملفات
يحتوي الآر على أوامر تسمح لك بقراءة البيانات من الملفات وتحميلها على شكل جداول في العادة النوع الأكثر استعمالا من البيانات هي الملفات النصية حيث تكون فواصل بين الحقول (مثلا فراغ , نقطة ،فاصلة,...إلخ) أو ملفات برامج الجدولة ( اكسل مثلا) محفوظة على شكل (سي . اس . في)
يوفر الآر دالتين لقراءة هذا النوع من البيانات, دالة
read.table
التي تسمح بقراءة الملفات النصية وتعطيك تحكما تاما في كيفية القراءة. مثلاً يمكنك أن تخبرها أن السطر الأول يمثل اسم الأعمدة وأن الحقول مفصولة بينها بفراغات بمفتاح
Tab وليس Space.
في هذا المقال سوف نأخذ كمثال مجموعة بيانات من عملاء امازون تحتوي على تقيممات النجوم وتاريخ المراجعة وملاحضاتهم لتحليل البيانات وتحليل مشاعرهم

البيانات المستخدمة
data

لرؤية أهم 10 أسطر من مخطط بيانات
إذا كان حجم البيانات كبيرا من الأفضل استعمال أمر
head
لاظهار الأسطر الأولى من الملف, في العادة للتأكد من أن القراءة تمت بالشكل الصحيح. يمكن أيضا
.dim معرفة عدد الأسطر وعدد الأعمدة باستعمال أم
يمكننا استعمال هذه الأوامر للتعرف على رسم الكلمات الأكثر شيوعاً في عامود ملاحظات العملاء :
استعمال هذه الأوامر للتعرف على عدد الكلمات المرتبطة بكل شعور



بعد ان تعرفنا على لغة ار سنتطرق الى مثال توضيحي حول كيفية التنبؤ بالبيانات

استعمال هذه الأوامر للتعرف على عدد الكلمات المرتبطة بكل شعور
الأمثلة