GitHub - manhlab/bert-tutorial: BERT default config for NLP Task

bert-tutorial

ru - DeepPavlov/rubert-base-cased-conversational es - dccuchile/bert-base-spanish-wwm-cased it - dbmdz/bert-base-italian-xxl-uncased tr - dbmdz/bert-base-turkish-cased pt - neuralmind/bert-large-portuguese-cased (didn't help, not included in our blend) fr - camembert/camembert-large

Data NLP Augumentation

https://github.com/makcedward/nlpaug

Imbanance Dataset

https://github.com/ufoym/imbalanced-dataset-sampler

Rank Averaging on Preprocessed Data

from scipy.stats import rankdata predict_list = [] predict_list.append(pd.read_csv("../input/textcnn-2d-convolution-on-preprocessed-data/submission.csv")[LABELS].values) predict_list.append(pd.read_csv("../input/lr-with-words-and-char-n-grams-preprocessed-data/submission.csv")[LABELS].values) predict_list.append(pd.read_csv("../input/pooled-gru-fasttext-on-preprocessed-data/submission.csv")[LABELS].values) predict_list.append(pd.read_csv("../input/cnn-3-out-of-fold-4-epochs-preprocessed-data/submit_cnn_avg_3_folds.csv")[LABELS].values) predict_list.append(pd.read_csv("../input/global-average-pool-on-preprocessed/submission.csv")[LABELS].values) predict_list.append(pd.read_csv("../input/lemmatization-pooled-gru-on-preprocessed-dataset/submission.csv")[LABELS].values) predict_list.append(pd.read_csv("../input/bilstm-on-preprocessed-data/submission.csv")[LABELS].values) predict_list.append(pd.read_csv("../input/wordbatch-fm-ftrl-on-preprocessed-data/lvl0_wordbatch_clean_sub.csv")[LABELS].values) print("Rank averaging on ", len(predict_list), " files") predictions = np.zeros_like(predict_list[0]) for predict in predict_list: for i in range(6): predictions[:, i] = np.add(predictions[:, i], rankdata(predict[:, i])/predictions.shape[0]) predictions /= len(predict_list)

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.vscode		.vscode
deploy/roberta-base		deploy/roberta-base
notebook		notebook
src		src
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

bert-tutorial

Data NLP Augumentation

Imbanance Dataset

Rank Averaging on Preprocessed Data

About

Uh oh!

Releases

Packages

Languages

manhlab/bert-tutorial

Folders and files

Latest commit

History

Repository files navigation

bert-tutorial

Data NLP Augumentation

Imbanance Dataset

Rank Averaging on Preprocessed Data

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages