Large text data token counting fast
In this blog I will share codes to count tokens from large dataset fast.
In this blog I will share codes to count tokens from large dataset fast.
In this blog I will note down some tips to process huggingface datasets
In this blog I will share how to process large CSV file using pandas
In this blog I will share how to do multiprocessing on large CSV file with iterator
In this blog I will share how to do simple multiprocessing in python over pandas dataframe
In this blog I will share how to do multiprocessing using concurrent in python
In this blog I will share how to build a minimal API using FastAPI to deploy your python app
In this blog I will share how to install git lfs in linux (ubuntu in my case)
In this blog I will provide a simple tips to load vocab.txt file using hugginface AutoTokenizer
In this blog I will try to share how to access remote jupyter lab in local machine
In this blog I will try to share simple usage of logging
In this blog I will try to share some use cases of python classmethod
This blog keep note about git reset use cases.
This blog keep note basic use cases of docker.
bnaug is a python tool to augment Bangla text.
Colab basic use cases and helpers
This blog describe about the basic use cases of screen
This blog describe about path
This blog post explain how supervised relation extraction method works.
This blog post explains how to train the relation extraction model with Flair.
This blog post explains different F1 score used in sequence tagging.
Review of paper BART
Review of paper PALM
This blog describes about the concept of LSTM
This blog describes about the concept of GRU
This blog describes about the concept of CTC
This blog describes about simple REST API using Flask.
This blog describes about using local git as remote repository.
This blog describes about most popular activation functions.
This blog describe how to build a neural network with backpropagation from scratch.
This blog describes about how to save and load model in Pytorch.
This blog describes about how to use Pytorch to build a simple model.
Dictionary হলো আইটেমের কালেকশন যেখানে প্রতি আইটেম হলো key আর value এর পেয়ার।
This blog describe how to download google drive file without login
পাইথন ফাংশনে আমরা যদি আর্গুমেন্টের সংখ্যা সম্পর্কে অবগত না থাকি তবে আমরা দুই ধরণের স্পেশাল আর্গুমেন্ট পাস করাতে পারি।
This blog post explains how to use bntranslit package for Bengali transliteration.
This blog describe how to process large corpora using python generator
This blog describes about text classification and sequence labeling in NLP.
This blog describe how to prepare a simple demo app using streamlit
This blog describe how to share your dataset using kaggle API
This blog describes about different classification metrics.
This blog describe about Bangla BERT lanaguage model.
This blog describes about how to use scikit-learn to classify iris data.
Let us assume we want to create a simple python package called calculator
পাইথনে টেবুলার ডাটা হ্যান্ডল করার জন্য Pandas একটি গুরুত্বপূর্ন টুল। নিচে Pandas এর কিছু স্পেশাল ট্রিক্স তুলে ধরা হলো। সময় অনুযায়ী ট্রিক্স এর লিস্ট বারতে থাক...
map ফাংশন প্যারামিটার হিসাবে একটি ফাংশন এবং একটি লিস্ট নেয় এবং পুরা লিস্টের উপর ফাংশনটি প্রয়োগ করে।
পাইথনে lambda ফাংশন হলো অজ্ঞাত ফাংশন যেটি একটি অবজেক্ট রিটার্ন
This blog describe how to handle string in python
This blog describe how to handle exception in python
This blog describe how to use multiple cuda version in ubuntu 16.04
This blog describe how to extract different compressed file using python
This blog describes about sentencepiece tokenizer.
This blog describe how to use argparse in python
This blog describes about ROUGE metric.
This blog describe how to use kaggle dataset in google colaboratory
You are an enthusiastic learner on Machine Learning but you have no capability to purchase a big machine to train and test your model.
This blog describe how to use pandas and matplotlib in python
পাইথনে একাধিক ফোল্ডার বা ডিরেক্টরি নিয়া কাজ করা একটা মহা ঝামেলার কাজ। এই ঝামেলার কাজ পাইথন os মডিউল দিয়ে সমাধান করা যায়। নিচে উদাহরণ সহ তলে ধরা হলো।
This blog describes about bag of words in NLP.
This blog describes about text preprocessing in NLP.
পাইথনে list এক ধরনের কন্টেইনার(পাত্র) হিসেবে কাজ করে, যা একই সঙ্গে অনেকগুলো ডাটা জমা করে রাখতে পারে। সেটের মত লিস্ট সাধারণত সাজানো এবং নির্দিষ্ট গণনাযোগ্য। ল...
পাইথনে collections মডুইল মূলত বিভিন্ন ডাটা কালেকশন(তথ্য সংগ্রহ) ফাংশন নিয়ে কাজ করে।
পাইথনে সাইন্টিফিক হিসাবপাতির জন্য Numpy হলো একটি কোর লাইব্রেরি। Numpy হাই-ডাইমেনশনাল অ্যারে এবং সেগুলো নিয়ে কাজ করার টুল প্রদান করে।
OS মডুইল অপারেটিং সিস্টেম ফাংশনালিটি নিয়ে কাজ করতে সাহায্য করে। এই মডুইল দিয়ে ডিরেক্টরি লিস্ট দেখা যায়, ডিরেক্টরি তৈরি করা যায়, ডিরেক্টরি অপসারণ করা যায়, বর্...
This blog describe how to install pyrouge in ubuntu 16.04
দৈবভাবে কোন নাম্বার চয়ন করা, দৈবভাবে কোন নাম্বার জেনারেট করা ইত্যাদি কাজের জন্য পাইথনে random মডুউলটি ব্যবহার করা হয়। এটি পাইথনের স্টানডার্ট লাইব্রেরির একটি ...
পাইথনে ফাইল ও ফাইল কালেকশন নিয়ে কাজ করার জন্য Shutil হল খুবেই কার্যকরি একটি মডুউল।
This blog describes about METEOR metric.
This blog describes about tokenization
This blog describes about beam search algorithm.
This blog describe about BLEU metric.
This blog describes about word embedding.
This blog describes about ngram.