برگه معرفی داده یادگیری عمیق

جدیدترین نسخه 1405

یادگیری عمیق

مرجع فارسی برای آشنایی با مجموعه‌داده‌ها، ابزارها و مفاهیم پایه یادگیری عمیق. از تصویر تا متن، مرجعی کامل و کاربردی.

مشاهده برگه مشاهده محتوا

+50

مجموعه‌داده

+120

موضوع پوشش‌داده‌شده

+3K

خواننده

ImageNet

+14 میلیون تصویر

NLP Dataset

+500K متن

GPU Ready

آماده آموزش

ویژگی‌های کلیدی

چرا این برگه متفاوت است؟

برگه‌ای که فقط معرفی نمی‌کند، بلکه مسیر یادگیری را از مفاهیم پایه تا پیاده‌سازی عملی روشن می‌سازد.

داده‌های تصویری

معرفی کامل مجموعه‌داده‌های تصویری از ImageNet تا CIFAR، COCO و سایر بنچمارک‌های استاندارد دنیای بینایی ماشین.

داده‌های متنی NLP

از متن‌های پارسی تا بنچمارک‌های بین‌المللی GLUE و SuperGLUE. آشنایی با توکنایزرها و آماده‌سازی داده برای ترانسفورمرها.

داده‌های سری زمانی

آشنایی با مجموعه‌داده‌های سری زمانی و روش‌های پیش‌پردازش آن‌ها برای مدل‌های RNN، LSTM و Transformer.

پیش‌پردازش حرفه‌ای

تکنیک‌های Data Augmentation، Normalization و Cleaning داده‌ها به‌صورت عملی با کد و توضیح کامل هر مرحله.

GPU و زیرساخت

راهنمای استفاده از GPU رایگان در Google Colab تا تنظیم محیط آموزش روی سرورهای اختصاصی با CUDA و cuDNN.

کد و پیاده‌سازی

کد نمونه PyTorch و TensorFlow برای هر مجموعه‌داده. از بارگذاری داده تا آموزش مدل، همراه با توضیح خط‌به‌خط.

مجموعه‌داده‌ها

مجموعه‌داده‌های پوشش‌داده‌شده

معرفی دقیق و عملی مهم‌ترین مجموعه‌داده‌های جهان یادگیری عمیق با جزئیات فنی کامل.

ImageNet ILSVRC

+14 میلیون تصویر در 1000 کلاس

تصویر

COCO Dataset

تشخیص شیء و سگمنتیشن

تصویر

SQuAD / GLUE

درک متن و بنچمارک NLP

متن

LibriSpeech

+1000 ساعت گفتار انگلیسی

صوت

UCI / Kaggle Datasets

جدولی، سری زمانی و تابولار

تابولار

ImageNet

14M تصویر 1000 کلاس

150 GB

CIFAR-10

60K تصویر 10 کلاس

160 MB

COCO

330K تصویر 80 کلاس

25 GB

SQuAD 2.0

150K سوال متن

40 MB

MNIST

70K تصویر 10 رقم

11 MB

LibriSpeech

1000 ساعت صوت

60 GB

محتوای برگه

مسیر آشنایی

از مفاهیم پایه تا پیاده‌سازی پیشرفته، هر مرحله با تمرین عملی و پروژه واقعی.

مبانی داده در یادگیری عمیق

آشنایی با انواع داده‌ها (تصویر، متن، صوت، تابولار)، مفهوم Tensor، و تفاوت داده‌ساختاریافته و ناساختاریافته.

Tensor Data Types Structured vs Unstructured

مجموعه‌داده‌های تصویری

بررسی عمیق ImageNet، CIFAR، MNIST، COCO و Fashion-MNIST. نحوه بارگذاری، بررسی آماری و نمایش نمونه‌ها.

ImageNet CIFAR COCO DataLoader

مجموعه‌داده‌های NLP

معرفی SQuAD، GLUE، WikiText و مجموعه‌داده‌های فارسی. توکنایزیشن، Vocabulary و آماده‌سازی متن برای ترانسفورمرها.

Tokenization GLUE Persian NLP

پیش‌پردازش و Data Augmentation

تکنیک‌های Normalization، Standardization، Cutout، Mixup، CutMix و سایر روش‌های افزایش داده با کد عملی.

Normalization Augmentation Mixup CutMix

DataLoader و Pipeline

ساخت Pipeline سفارشی با PyTorch DataLoader، TensorFlow tf.data. مدیریت حافظه، batching و تنظیمات performance.

PyTorch tf.data Batching

پروژه عملی End-to-End

پیاده‌سازی کامل یک پروژه از جمع‌آوری داده تا ارزیابی مدل. ساخت Dataset سفارشی، آموزش و تحلیل نتایج.

End-to-End Custom Dataset Evaluation

مقایسه سرعت یادگیری

بدون برگه راهنما

35%

با برگه معرفی داده

92%

بازدهی پروژه

88%

درک مفاهیم پایه

95%

چرا این برگه؟

برگه‌ای که مسیر را روشن می‌کند

این برگه فقط معرفی نیست؛ یک نقشه راه عملی است که زمان سرگردانی شما را نصف می‌کند.

محتوای فارسی و بومی‌سازی‌شده

تمام مفاهیم سخت یادگیری عمیق به زبان ساده فارسی توضیح داده شده‌اند. نیازی به جستجوی سنگین در منابع انگلیسی نیست.

کد عملی و قابل اجرا

هر بخش با کد PyTorch و TensorFlow همراه است. کد‌ها تست‌شده و آماده اجرا در Google Colab هستند.

به‌روزرسانی مداوم

مجموعه‌داده‌ها و ابزارها دائماً به‌روز می‌شوند. با آخرین بنچمارک‌ها و تکنیک‌ها همیشه جلو هستید.

پشتیبانی و کامیونیتی

دسترسی به انجمن اختصاصی برای پرسش و پاسخ، اشتراک‌گذاری پروژه‌ها و تبادل تجربه با سایر یادگیرندگان.

مخاطبین

این برگه برای کیست؟

چه مبتدی باشید چه حرفه‌ای، این برگه ارزش متفاوتی برای هر سطح دارد.

دانشجویان

دانشجویان کامپیوتر و هوش مصنوعی که می‌خواهند پایه داده‌ای قوی برای پروژه‌ها و پایان‌نامه بسازند.

توسعه‌دهندگان

برنامه‌نویسانی که می‌خواهند وارد دنیای ML/DL شوند و نیاز به شناخت اکوسیستم داده دارند.

پژوهشگران

محققانی که به دنبال مرجع سریع برای انتخاب مجموعه‌داده مناسب و تکنیک‌های پیش‌پردازش هستند.

حرفه‌ای‌ها

مهندسان داده و ML Engineer‌هایی که می‌خواهند دانش خود را به‌روز و سیستماتیک کنند.

ابزارها

ابزارها و تکنولوژی‌ها

تکنولوژی‌ها و فریم‌ورک‌هایی که در طول این برگه با آن‌ها آشنا می‌شوید.

PyTorch

TensorFlow

Python

CUDA

NumPy

Pandas

OpenCV

HuggingFace

Weights & Biases

Google Colab

Matplotlib

Albumentations

تجربه کاربران

کاربران چه می‌گویند؟

تجربه کسانی که با این برگه مسیر یادگیری خود را شروع کرده‌اند.

قبل از این برگه ساعت‌ها وقت صرف پیدا کردن مجموعه‌داده مناسب می‌کردم. الان فقط بازش می‌کنم و همه‌چیز آماده است. کدهای PyTorch واقعاً کاربردی بودند.

سارا محمدی

دانشجوی کارشناسی ارشد AI

بهترین مرجع فارسی که دیدم. تکنیک‌های Augmentation خیلی واضح توضیح داده شده و کدها رو مستقیم توی Colab اجرا کردم. به‌عنوان مرجع عالی کار می‌کنه.

علی رضایی

Backend Developer

به‌عنوان کسی که تازه وارد DL شدم، این برگه کمک کرد مفاهیم پایه داده رو سریع یاد بگیرم و اولین پروژه‌ام رو با راهنمایی‌اش کامل پیاده کنم.

مریم احمدی

Data Analyst

همین الان مطالعه کنید

آماده‌اید داده‌های یادگیری عمیق را بشناسید؟

برگه معرفی داده یادگیری عمیق، مرجع کاملی برای شناخت مجموعه‌داده‌ها، ابزارها و مفاهیم پایه است. دسترسی آزاد و رایگان.

مشاهده برگه مشاهده محتوا

دسترسی آزاد

به‌روزرسانی مداوم

کدهای آماده اجرا

انجمن پشتیبان

سوالات متداول

سوالات پرتکرار

آیا نیاز به دانش قبلی یادگیری عمیق دارم؟

خیر، این برگه از صفر شروع می‌شود. فقط آشنایی اولیه با پایتون کافی است. مفاهیم پایه یادگیری عمیق در همان بخش اول به‌صورت ساده توضیح داده شده‌اند و سپس وارد جزئیات مجموعه‌داده‌ها می‌شوید.

آیا کدها در Google Colab قابل اجرا هستند؟

بله، تمام کدها در Google Colab تست شده‌اند و لینک مستقیم Colab برای هر بخش درج شده است. نیازی به تنظیم محیط محلی ندارید؛ فقط یک حساب Gmail کافی است.

آیا مجموعه‌داده‌های فارسی هم پوشش داده شده‌اند؟

بله، در بخش NLP مجموعه‌داده‌های متن فارسی از جمله ParsBERT و سایر بنچمارک‌های فارسی معرفی شده‌اند. همچنین روش‌های ساخت Dataset سفارشی فارسی آموزش داده شده است.

آیا به GPU نیاز دارم؟

برای اکثر تمرین‌ها، GPU رایگان Google Colab کافی است. در بخش زیرساخت، راهنمای کامل استفاده از GPU رایگان و پولی ارائه شده است. برای مجموعه‌داده‌های کوچک مثل MNIST حتی CPU هم جواب می‌دهد.

آیا این برگه رایگان است؟

بله، این برگه به‌صورت آزاد و رایگان در دسترس است. تمام به‌روزرسانی‌های آینده (مثل اضافه شدن مجموعه‌داده‌های جدید و تکنیک‌های نوین Augmentation) نیز رایگان خواهد بود.

درخواست مشاوره کاملا رایگان!

ثبت درخواست