[Bugfix] TransformerXL LayerNorm eps and XLNet pretrained model config #1005

leezu · 2019-11-13T09:25:46Z

Checklist

Essentials

PR's title starts with a category (e.g. [BUGFIX], [MODEL], [TUTORIAL], [FEATURE], [DOC], etc)
Changes are complete (i.e. I finished coding on this PR)
All changes have test coverage
Code is well-documented

Changes

Fix TransformerXL LayerNorm eps. Change from 1e-12 to 1e-5

Comments

We previously asserted that our implementation computes the same result as the pytorch-transformers implementation. However, that implementation was wrong up until 1.2.0 release in which their implementation was fixed unintentionally / by accident in huggingface/transformers#1089.

This also updates the comparison scripts which broke to API breakage in the packages that we compare to (renaming / reordering of arguments etc.).

Also updates gelu to approx_gelu in the XLNet pretrained model configuration, which should have been done in #988.

cc @dmlc/gluon-nlp-team
@zburning FYI

codecov · 2019-11-13T09:25:50Z

Codecov Report

Merging #1005 into master will increase coverage by 0.01%.
The diff coverage is n/a.

@@ Coverage Diff @@ ## master #1005 +/- ## ========================================== + Coverage 89.93% 89.95% +0.01%  ========================================== Files 67 67 Lines 6340 6340 ========================================== + Hits 5702 5703 +1  + Misses 638 637 -1

Impacted Files	Coverage Δ
src/gluonnlp/model/transformer.py	`91.63% <0%> (+0.32%)`	⬆️

mli · 2019-11-13T09:59:33Z

Job PR-1005/1 is complete.
Docs are uploaded to http://gluon-nlp-staging.s3-accelerate.dualstack.amazonaws.com/PR-1005/1/index.html

mli · 2019-11-15T10:25:07Z

Job PR-1005/2 is complete.
Docs are uploaded to http://gluon-nlp-staging.s3-accelerate.dualstack.amazonaws.com/PR-1005/2/index.html

mli · 2019-11-18T08:20:08Z

Job PR-1005/3 is complete.
Docs are uploaded to http://gluon-nlp-staging.s3-accelerate.dualstack.amazonaws.com/PR-1005/3/index.html

np.unravel_index argument names changed in v1.16.0. scripts/language_model/conversion_utils/compare_transformerxl_pytorch_gluon_model.py requires v1.16.0 due to making use of the updated argument names. This was previously not correctly declared.

mli · 2019-11-20T09:06:59Z

Job PR-1005/4 is complete.
Docs are uploaded to http://gluon-nlp-staging.s3-accelerate.dualstack.amazonaws.com/PR-1005/4/index.html

leezu requested a review from a team as a code owner November 13, 2019 09:25

leezu changed the title ~~[Fix] TransformerXL LayerNorm eps and XLNet pretrained model config~~ [Bugfix] TransformerXL LayerNorm eps and XLNet pretrained model config Nov 13, 2019

leezu added the release focus Progress focus for release label Nov 15, 2019

leezu force-pushed the fixtransformerxllayernormeps branch from 01de29d to d3b9e1d Compare November 18, 2019 07:43

leezu added 6 commits November 20, 2019 08:22

Fix third party API change

55d78aa

Assert max_error

790da46

Update TransformerXL LayerNorm eps

1f81a66

Fix XLNet model configurations after dmlc#988

83e2801

Support transformers>=2.1.0

ad9e0cf

Declare numpy 1.16.0 dependency

2de2a99

np.unravel_index argument names changed in v1.16.0. scripts/language_model/conversion_utils/compare_transformerxl_pytorch_gluon_model.py requires v1.16.0 due to making use of the updated argument names. This was previously not correctly declared.

leezu force-pushed the fixtransformerxllayernormeps branch from d3b9e1d to 2de2a99 Compare November 20, 2019 08:22

szha approved these changes Nov 28, 2019

View reviewed changes

leezu merged commit b2f4e7b into dmlc:master Nov 28, 2019

leezu deleted the fixtransformerxllayernormeps branch November 28, 2019 04:04

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[Bugfix] TransformerXL LayerNorm eps and XLNet pretrained model config #1005

[Bugfix] TransformerXL LayerNorm eps and XLNet pretrained model config #1005

Uh oh!

leezu commented Nov 13, 2019 •

edited

Loading

codecov bot commented Nov 13, 2019 •

edited

Loading

mli commented Nov 13, 2019

mli commented Nov 15, 2019

mli commented Nov 18, 2019

mli commented Nov 20, 2019

Labels

3 participants

[Bugfix] TransformerXL LayerNorm eps and XLNet pretrained model config #1005

[Bugfix] TransformerXL LayerNorm eps and XLNet pretrained model config #1005

Uh oh!

Conversation

leezu commented Nov 13, 2019 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Checklist

Essentials

Changes

Comments

codecov bot commented Nov 13, 2019 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Codecov Report

mli commented Nov 13, 2019

mli commented Nov 15, 2019

mli commented Nov 18, 2019

mli commented Nov 20, 2019

Labels

3 participants

leezu commented Nov 13, 2019 •

edited

Loading

codecov bot commented Nov 13, 2019 •

edited

Loading