خانه‌ی سفید

نوشته‌های شخصی مجید در مورد همه چیز

خانه‌ی سفید

نوشته‌های شخصی مجید در مورد همه چیز

چرا گنو/لینوکس را دوست دارم

سایت سیتو (فروشنده CD و DVD نرم‌افزارهای آزاد از جمله تعداد بسیار زیادی از توزیع‌های گنو/لینوکس و البته هدیه‌های لینوکسی مثل ماوس‌پد و ...) یک مسابقه گذاشته با این عنوان: چرا گنو/لینوکس را دوست دارم.


و اما چرا گنو/لینوکس را دوست دارم:


۱. مهاجرت من به گنو/لینوکس زمانی شروع شد که وایرلس لپ‌تاپم خراب شد! مشکل با نصب درایور و حذف و نصب دوباره برنامه‌های مربوطه حل نشد. چاره‌ای نمانده بود جز نصب دوباره ویندوز. در چند روزی که هنوز فرصت ریکاوری لپ‌تاپ را پیدا نکرده بودم، دانشگاه که می‌رفتم با دیسک زنده اوبونتو سیستم را بالا می‌آوردم و به اینترنت وصل می‌شدم. این شد که هر چند قبلا چندباری از سر کنجکاوی سراغ گنو/لینوکس رفته بودم (ردهت ۹) ولی کار من با گنو/لینوکس از سر نیاز شروع شد (اوبونتو ۸.۰۴)


۲. دائمی شدن مهاجرت: اشتباهی زدم ویندوزم را خراب کردم . این بهترین اتفاقی بود که می‌توانست برایم بیافتد.


۳. بعد از مهاجرت به گنو/لینوکس سعی کردم در حیطه تخصصی خودم نرم‌افزارهای آزاد را یاد بگیرم و با آن‌ها کار کنم. در حال حاضر تمامی محاسبات آمار و اقتصادسنجی خودم را با R انجام می‌دهم.


۴. و اما کاری که من با گنو/لینوکس به راحتی انجام دادم!


یکی از حوزه‌های تخصصی من کار روی داده‌های خام آمارگیری از هزینه و درآمد خانوار است که مرکز آمار ایران از سالیان دور انجامش می‌دهد. مرکز آمار یک سری تحلیل‌ها روی این داده‌های خام انجام می‌دهد و نتایج را به شکل گزارش‌هایی روی سایتش منتشر می‌کند ولی برای پاسخ‌گویی به خیلی سوالات لازم است تحلیل‌های بیشتری روی داده‌های خام انجام شود. 

خوشبختانه مرکز آمار ایران داده‌های خام را (برخلاف بانک مرکزی) به شکل عمومی عرضه می‌کند و همه پژوهشگران می‌توانند با مراجعه به واحد فروش داده‌های این مرکز (خیابان فاطمی) آن‌ها را تهیه کنند.

داده‌های خام هر سال که مربوط به حدود ۱۰ الی ۲۰ هزار خانوار شهری و تقریبا در همین حدود خانوار روستایی است در تعداد زیادی جدول در یک فایل اکسس حدود ۲۰۰ مگابایتی عرضه می‌شود.

من می‌خواستم روی این داده‌ها توی R کار کنم. بهترین راه این بود که جداول اکسس را export کنم به فرمت CSV و در R از آنها استفاده کنم. مشکل اینجاست که در export کردن جداول اکسس هر بار فقط یک جدول را می‌تواند اکسپرت کرد! من فایل‌های اکسس ۲۸ سال را دارم. هر فایل هم بیش از ۲۰-۳۰ جدول دارد. این یعنی حدود ۵۰۰-۹۰۰ جدول برای export کردن!! و اینجاست که هر گیکی مطمئنا برنامه می‌نویسد!


برای استخراج جداول از فایل اکسس از ابزار نرم‌افزار آزاد mdbtools استفاده می‌کنم. و برنامه‌ای با دستورات bash نوشته‌ام که برای استخراج جداول و تر و تمیز کردن آن‌ها کافی است بنویسم:

m-extract-HEIS 88.mdb

یا برای همه فایل‌هایم (که خوب کار روی چند گیگ فایل چند دقیقه‌ای هم طول می‌کشد!

m-extract-HEIS *.mdb


برنامه m-extract-HEIS را می‌توانید از گیست https://gist.github.com/4602610 دریافت کنید.


۵. مشارکت در دنیای نرم‌افزار آزاد

الف. من یک بار در فروم پارسی‌لاتک یک پیشنهادی داده بودم که بعدا این پیشنهاد توی فایل راهنمای استایل‌های فارسی بیب‌تک اومد و توش از من تشکر کرده بودند!!! الان اسم من توی هزاران هزار توزیع تک که روی کامپیوترهای کلی آدم توی دنیا نصب شده توی یه فایلی اون گوشه موشه‌ها دیده می‌شه!!!


ب. برای کارم نیاز به اجرای یک الگوریتم داشتم که یک بنده خدایی در فرانسه برایش یک بسته R نوشته بود. از این بسته استفاده می‌کردم تا اینکه متوجه شدم در یک شرایط خاص یک باگ داره. اگر من از نرم‌افزارهای غیر آزاد استفاده می‌کردم احتمالا نمی‌توانستم بفهمم مشکل از چیست و حتی اگر می‌فهمیدم نمی‌توانستم مشکل را حل کنم! ولی R نرم‌افزار آزاد هست و بسته مزبور با لایسنس GPL ارائه شده، پس من تونستم که متن توابعش رو بخونم، ایراد رو پیدا کنم و حتی پس از حل مشکل، امکانات بسته رو بیشتر کردم و یک بسته جدید نوشتم!!! الان این بسته تو نسخه ۰٫۸ هست و می‌خوام وقتی به اندازه کافی خوب بود بفرستمش CRAN تا هزاران هزار نفری که از R استفاده می‌کنند از بسته من هم بتوانند استفاده کنند.



نظرات 3 + ارسال نظر
فاطمه چهارشنبه 4 بهمن 1391 ساعت 10:56 http://manism.blogsky.com/

جالبه من که هنوز با ویندوز کار میکنم اما لینوکسو واسه بعد از کنکور حتما تو برنامم میزارم

علی آقا جمعه 6 بهمن 1391 ساعت 22:16 http://alihzadeh.blog.ir

سلام.
جالب بود که شما هم مثل من بر اثر خرابی در ویندوز به سمت لینوکس اومدین.

بهروزم یکشنبه 21 مهر 1392 ساعت 01:02 http://behroozam.ir

درود . خیلی اتفاقی بعد از دیدن مستند میراث البرتا و سرچ کردن قضیه دفن شهدا در دانشگاه شریف به وبلاگتون برخوردم . فکر نمیکردم گنو باز باشین . من خوب از دستورات ترمینال استفاده میکنم ولی بیشتر در رمحیط mac ولی واسه ادیت فایل های php و htm بیشتر متوسل به اکلیپس و بلوفیش میشم . فعلا فدورا کار میکنم به نظرم ابونتو خز شده . هرچند با توزیع های دبیان بیشتر راحت بودم . منم از این فروشگاه سیتو خرید کردم یه تیشرت ابونتو البته . جنسش خوبه شاید بعدا یه سیسکو هم گرفتم.

بدرود و خوش باشید و پاینده

برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
ایمیل شما بعد از ثبت نمایش داده نخواهد شد