Data Nerd

Data Nerd Web Scraping | Data Engineering | Skill Monitizations
https://www.datanerd.academy/

01/05/2026

Data Nerd is verified 🤝

As the blessed month of Ramadan begins, may it bring peace to your heart, clarity to your mind, and strength to your sou...
18/02/2026

As the blessed month of Ramadan begins, may it bring peace to your heart, clarity to your mind, and strength to your soul.

May your fasts be easy, your prayers be accepted, and your days be filled with patience, gratitude, and kindness.

Wishing you and your family a month full of blessings, mercy, and spiritual growth.

May Allah accept all our good deeds and guide us on the straight path.

Ramadan Mubarak to you and your loved ones.

29/01/2026

পাইথন Pandas ইউজ করে যেভাবে সহজে CSVতে Data Extarct করা যায়

বেশিরভাগ বিগিনার এমন প্রজেক্ট বানায় যেগুলো YouTube থাম্বনেইলে দেখতে দারুণ, কিন্তু রেজিউমেতে একেবারেই কাজে আসে নাপ্রোজেক...
10/01/2026

বেশিরভাগ বিগিনার এমন প্রজেক্ট বানায় যেগুলো YouTube থাম্বনেইলে দেখতে দারুণ, কিন্তু রেজিউমেতে একেবারেই কাজে আসে না

প্রোজেক্টে ইলন মাস্কের টুইটের সেন্টিমেন্টাল এনালাইসিস Recruiter এর কাছে কোনো সেন্স মেক করে না!

তারা যেটা দেখে, সেটা হলো
pipeline, orchestration, data quality, scalability, reproducibility
মানে, যেসব জিনিস প্রোডাকশনে রাত ২টায় সেন্সলেস হয়ে যায়

তাই এখানে এমন ১০টা REAL প্রজেক্টের লিস্ট দিলাম, যেগুলো দেখলেই মনে হবে

➜ “হ্যাঁ, এই লোকটা real-world data engineering বোঝে”
➜ “হ্যাঁ, messy ডেটা নিয়ে কাজ করতে পারে”
➜“হ্যাঁ, Airflow ১৮টা error দিলেও পালিয়ে যাবে না”

𝟭. 𝗥𝗲𝗮𝗹-𝗧𝗶𝗺𝗲 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗣𝗶𝗽𝗲𝗹𝗶𝗻𝗲 (𝗞𝗮𝗳𝗸𝗮 + 𝗦𝗽𝗮𝗿𝗸 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴)

আজকের দিনে Streaming সবচেয়ে বড় skill gap

লাইভ ডেটা প্রসেস করার একটা pipeline বানান
log data, sensor data, clickstream যেটাই হোক

যা দেখাবেন:
➜ Kafka topics (raw → cleaned → curated)
➜ Spark Streaming transformations
➜ Delta Lake বা Postgres-এ লেখা
➜ Grafana ড্যাশবোর্ড

𝟮. 𝗘𝗻𝗱-𝘁𝗼-𝗘𝗻𝗱 𝗕𝗮𝘁𝗰𝗵 𝗣𝗶𝗽𝗲𝗹𝗶𝗻𝗲 (𝗣𝘆𝗦𝗽𝗮𝗿𝗸 + 𝗔𝗶𝗿𝗳𝗹𝗼𝘄)

ডেটা ইঞ্জিনিয়ারিংয়ের ক্লাসিক প্রজেক্ট
একটা messy CSV নিন, তারপর বানান

➜ Raw ingestion
➜ Transformations (join, aggregation, deduplication)
➜ Airflow DAG
➜ Data quality checks
➜ Final analytics table

Folder structure, logging, আর DAG graph দেখাতে পারলে pure gold

𝟯. 𝗗𝗮𝘁𝗮 𝗪𝗮𝗿𝗲𝗵𝗼𝘂𝘀𝗲 & 𝗗𝗶𝗺𝗲𝗻𝘀𝗶𝗼𝗻𝗮𝗹 𝗠𝗼𝗱𝗲𝗹𝗶𝗻𝗴 (𝗦𝗻𝗼𝘄𝗳𝗹𝗮𝗸𝗲 / 𝗕𝗶𝗴𝗤𝘂𝗲𝗿𝘆)

শুধু “Snowflake-এ ডেটা লোড না করে
একটা পুরো Star Schema বানান

উদাহরণ:
Fact: Sales
Dimensions: Customers, Products, Time

তারপর এমন SQL লিখুন যেগুলো analyst সত্যিই ব্যবহার করবে

𝟰. 𝗗𝗲𝗹𝘁𝗮 𝗟𝗮𝗸𝗲 দিয়ে 𝗗𝗮𝘁𝗮 𝗟𝗮𝗸𝗲𝗵𝗼𝘂𝘀𝗲

Delta Lake + Spark দিয়ে:
Bronze → Silver → Gold pipeline

Highlight করবেন:
➜ Schema evolution
➜ Time travel
➜ Z-ordering
➜ Optimize commands
Autoloader (chef’s kiss 🤌)

𝟱. 𝗔𝗣𝗜 𝗗𝗮𝘁𝗮 𝗣𝗶𝗽𝗲𝗹𝗶𝗻𝗲 (𝗣𝘆𝘁𝗵𝗼𝗻 + 𝗦𝟯 + 𝗚𝗹𝘂𝗲)

Real job-এ REST API নিয়ে কাজ করতেই হয়

Flow:
API → S3 (raw) → Glue ETL → Athena → QuickSight dashboard
একদম resume-friendly AWS pipeline

𝟲. 𝗗𝗮𝘁𝗮 𝗤𝘂𝗮𝗹𝗶𝘁𝘆 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸 (𝗚𝗿𝗲𝗮𝘁 𝗘𝘅𝗽𝗲𝗰𝘁𝗮𝘁𝗶𝗼𝗻𝘀)

খুব কম beginner এটা বানায় এটাই আপনার বড় advantage

Checks যোগ করুন:
➜ Duplicate check
➜ Null check
➜ Schema validation
➜ Threshold check
➜ Distribution check
➜ Automated validation + রিপোর্ট দেখাতে পারলে 🔥

𝟳. 𝗗𝗮𝘁𝗮 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗗𝗮𝘀𝗵𝗯𝗼𝗮𝗿𝗱

Logs, metrics, alerts সব একসাথে

Use করুন:
➜ Prometheus
➜ Grafana
➜ Custom log parser
➜ Slack alerts

কোম্পানিগুলো এটা ভীষণ পছন্দ করে
অনেক DE-ই observability জানে না আপনি আলাদা হয়ে যাবেন

𝟴. 𝗠𝗮𝗰𝗵𝗶𝗻𝗲 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 𝗙𝗲𝗮𝘁𝘂𝗿𝗲 𝗦𝘁𝗼𝗿𝗲 (𝗙𝗲𝗮𝘀𝘁)

ML জানা লাগবে না,শুধু feature engineering

Pipeline:
Raw → cleaned → aggregated → feature store → ML model fetch

এতে বোঝা যায় আপনি MLOps-এর DE দিকটা বোঝেন

𝟵. 𝗟𝗮𝗿𝗴𝗲 𝗙𝗶𝗹𝗲 𝗣𝗿𝗼𝗰𝗲𝘀𝘀𝗶𝗻𝗴 (𝗦𝗽𝗮𝗿𝗸 𝗢𝗽𝘁𝗶𝗺𝗶𝘇𝗮𝘁𝗶𝗼𝗻)

৫০-২০০GB ডেটাসেট ব্যবহার করুন (Kaggle বা পাবলিক সোর্স)

Show করুন:
➜ Partitioning
➜ Predicate pushdown
➜ Broadcast join
➜ Caching
➜ Cluster config tuning

এটা প্রমাণ করে আপনি শুধু CSV-level Spark user না

𝟭𝟬. 𝗙𝘂𝗹𝗹 𝗣𝗼𝗿𝘁𝗳𝗼𝗹𝗶𝗼: “𝗖𝗼𝗺𝗽𝗮𝗻𝘆-𝗟𝗲𝘃𝗲𝗹 𝗗𝗮𝘁𝗮 𝗣𝗹𝗮𝘁𝗳𝗼𝗿𝗺”

এটাই ultimate প্রজেক্ট
এর মধ্যে থাকবে

➜ Batch + streaming ingestion
➜ Lakehouse (bronze → silver → gold)
➜ Airflow orchestration
➜ Data quality
➜ Data warehouse
➜ Dashboard
➜ Documentation

এটা দেখলেই মনে হবে:
“এই লোকটা production-grade platform ডিজাইন ও বানাতে পারে”

টিপস: Formatting যতটা ভাবছেন, তার চেয়েও বেশি গুরুত্বপূর্ণ
ভালো documentation-ওয়ালা junior দেখতেই senior লাগে

Include:
➜ Architecture diagram
➜ ER diagram
➜ Folder structure
➜ Pipeline running GIF
➜ SQL queries
➜ Airflow DAG screenshots
➜ পরিষ্কার README

Final কথা: ১০টা না, ৩টা প্রজেক্ট ভালো করে বানান
রিক্রুটার ১০টা half-baked প্রজেক্ট দেখতে চায় না....

এই ৩টা নিলেই যথেষ্ট:
➜ ১টা Streaming
➜ ১টা Batch + Orchestration
➜ ১টা Warehouse বা Lakehouse

সব GitHub-এ সুন্দর করে সাজান

SAVE & SHARE

সংগৃহীত

Top Python Libraries for Web Scrapping
04/12/2025

Top Python Libraries for Web Scrapping

From Top Performer → Rising Talent on UpworkHard work + consistent effort সবসময় ফল দেয়।Upwork-এ Rising Talent হওয়ার জন্য...
03/12/2025

From Top Performer → Rising Talent on Upwork

Hard work + consistent effort সবসময় ফল দেয়।

Upwork-এ Rising Talent হওয়ার জন্য অভিনন্দন! 👏

Mahbub Congratulations 🤝

৭টি ভলান্টিয়ারিং ওয়েবসাইটযেখানে নতুন ডেটা অ্যানালিস্টরা রিয়েল এক্সপিরিয়েন্স গেইন সাহায্য করবে
15/10/2025

৭টি ভলান্টিয়ারিং ওয়েবসাইট
যেখানে নতুন ডেটা অ্যানালিস্টরা রিয়েল এক্সপিরিয়েন্স গেইন সাহায্য করবে

press F2 to skip
15/10/2025

press F2 to skip

Address

166, (4th Floor), Sultanabad, New Market Ghoramara
Rajshahi
6100

Alerts

Be the first to know and let us send you an email when Data Nerd posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Share