2 years ago[libc] Generate math.h instead of the static file it is currently.
[libc] Generate math.h instead of the static file it is currently.

Just enough to help a follow up patch adding cosf and sinf has been

2 years ago[MLIR][NFC] std::is_same || -> llvm::is_one_of
[MLIR][NFC] std::is_same || -> llvm::is_one_of

 Switch std::is_same disjunctions to llvm::is_one_of

2 years ago[gn build] Port ba1f4405c68
[gn build] Port ba1f4405c68

2 years ago[profile] Move RuntimeCounterRelocation and ProfileDumped into a separate file
[profile] Move RuntimeCounterRelocation and ProfileDumped into a separate file

This avoids the test failure that was introduced in rG32bddad where
this function pulls in the rest of InstrProfilingFile.c which is
undesirable in use cases when profile runtime is being used without
the rest of libc.

This also allows additional cleanup by eliminating another variable
from platforms that don't need it.

2 years agoRevert "[libc++] Build the dylib with C++17 to allow aligned new/delete"
Revert "[libc++] Build the dylib with C++17 to allow aligned new/delete"

This reverts commit 1ac403bd145dadfa1004af29bd6c77f871caf42c, which
broke some non-libc++ build bots because they use an ancient CMake.

2 years ago[NFC][Test][PowerPC] Add one test to verify the behavior of vector
[NFC][Test][PowerPC] Add one test to verify the behavior of vector
mul/add for v8i16

2 years agoAMDGPU/GlobalISel: Add a testcase for G_UNMERGE_VALUES legalization
AMDGPU/GlobalISel: Add a testcase for G_UNMERGE_VALUES legalization

I had a note that this doesn't work, but it seems to now.

2 years ago[profile] Make atexit hook a no-op on Fuchsia
[profile] Make atexit hook a no-op on Fuchsia

On Fuchsia, we always use the continuous mode with runtime counter
relocation, so there's no need for atexit hook or support for dumping
the profile manually.

2 years ago[libc++] Update a bad documentation link
[libc++] Update a bad documentation link

2 years agoAMDGPU/GlobalISel: Add some end to end tests for fma selection
AMDGPU/GlobalISel: Add some end to end tests for fma selection

2 years agoRevert "Allow remapping Clang module include paths"
Revert "Allow remapping Clang module include paths"

to investigate why this commit broke a test in the LLDB testsuite.

This reverts commit dca920a904c27f4c86e909ef2e4e343d48168cca.

2 years agoAMDGPU/GlobalISel: Add select patterns for v_and_or_b32
AMDGPU/GlobalISel: Add select patterns for v_and_or_b32

2 years agoAMDGPU/GlobalISel: Add load legalization tests
AMDGPU/GlobalISel: Add load legalization tests

2 years agoAMDGPU/GlobalISel: Add missing tests for G_FRINT selection
AMDGPU/GlobalISel: Add missing tests for G_FRINT selection

2 years agoAllow remapping Clang module include paths
Allow remapping Clang module include paths


2 years agoAdd an -object-path-prefix option to dsymutil
Add an -object-path-prefix option to dsymutil

to remap object file paths (but no source paths) before
processing. This is meant to be used for Clang objects where the
module cache location was remapped using ``-fdebug-prefix-map``; to
help dsymutil find the Clang module cache.


2 years agoGlobalISel: Introduce bitcast legalize action
GlobalISel: Introduce bitcast legalize action

For some operations, the type is unimportant and only the number of
bits matters. For example I don't want to treat <4 x s8> as a legal
type, but I also don't want to decompose loads of this into smaller
pieces to get legal register types.

On AMDGPU in SelectionDAG, we legalize a number of operations (most
notably load and store) by coercing all types to vectors of i32. For
GlobalISel, I'm trying very hard to avoid doing this for every type,
but I don't think this strategy can be completely avoided. I'm trying
to avoid bitcasts for any legitimately legal type we can operate on,
since the intervening bitcasts have proven to be a hassle.

For loads, I think I can get away without ever casting the result
type, and handling any arbitrary bitwidth during selection (I will
eventually want new tablegen support to help with this, rather than
having to add every possible type as legal). The unmerge required to
do anything with the value should expand to the expected shifts. This
is trickier for stores, since it would now require handling a wide
array of truncates during selection which I don't want.

Future potentially interesting case are for vector indexing, where
sub-dword type should be indexed in s32 pieces.

2 years ago[mlir][GPU] Use StructAttr to drive lowering from loop.parallel to
[mlir][GPU] Use StructAttr to drive lowering from loop.parallel to

Current implementation of lowering from loop.parallel to gpu.launch
uses a DictionaryAttr to specify the mapping. Moving this attribute to
be auto-generated from specification as a StructAttr. This simplifies
a lot the logic of looking up and creating this attribute.

2 years agoAdd a `Symbolizer::GetEnvP()` method that allows symbolizer implementations to custom...
Add a `Symbolizer::GetEnvP()` method that allows symbolizer implementations to customise the environment of the symbolizer binary.

This change introduces the `Symbolizer::GetEnvP()` method that returns a
pointer to environment array used for spawning the symbolizer process.
The motivation is to allow implementations to customise the environment
if required.  The default implementation just returns
`__sanitizer::GetEnviron()` which (provided it's implemented) should
preserve the existing behaviours of the various implementations.

This change has been plumbed through the `internal_spawn(...)` and
`StartSubprocess(...)` process spawning implementations.

For the `StartSubprocess()` implementation we need to call `execve()`
rather than `execv()` to pass the environment. However, it appears that
`internal_execve(...)` exists in sanitizer_common so this patch use that
which seems like a nice clean up.

Support in the Windows implementation of
`SymbolizerProcess:StartSymbolizerSubprocess()` has not been added
because the Windows sanitizer runtime doesn't implement `GetEnviron()`.


2 years ago[LVI] Convert some checks to assertions; NFC
[LVI] Convert some checks to assertions; NFC

solveBlockValue() should only be called if the value isn't cached
yet. Similarly, it does not make sense to "solve" a constant.

2 years ago[libc++] Install a recent CMake in the Docker build bots
[libc++] Install a recent CMake in the Docker build bots

2 years ago[libc++] Build the dylib with C++17 to allow aligned new/delete
[libc++] Build the dylib with C++17 to allow aligned new/delete

This allows simplifying the implementation of barriers.

2 years ago[GWP-ASan] Only pack frames that are stored.
[GWP-ASan] Only pack frames that are stored.

Backtrace() returns the number of frames that are *available*, rather
than the number of frames stored. When we pack, we supply the number of
frames we have stored. The number of available frames can exceed the
number of stored frames, leading to stack OOB read.

Fix up this problem.

2 years ago[clang codegen] Clean up handling of vectors with trivial-auto-var-init.
[clang codegen] Clean up handling of vectors with trivial-auto-var-init.

The code was pretending to be doing something useful with vectors, but
really it was doing nothing: the element type of a vector is always a
scalar type, so constWithPadding would always just return the input constant.

Split off from D75661 so it can be reviewed separately.

While I'm here, also add testcase to show missing vector handling.

2 years ago[test][clang][driver] Add required features.
[test][clang][driver] Add required features.

- to avoid false alarms on builds without that features.

2 years ago[AArch64][GlobalISel] Don't localize TLS G_GLOBAL_VALUEs on Darwin.
[AArch64][GlobalISel] Don't localize TLS G_GLOBAL_VALUEs on Darwin.

On Darwin these need to be selected into a function call for the TLS
address lookup. As a result, they can't be moved below a physreg write,
which happens in call sequences. In the long term, we should have some
mechanism in the localizer to prevent localizing into target-specific
atomic instruction sequences.


2 years ago[Attributor] Use knowledge retained in llvm.assume (operand bundles)
[Attributor] Use knowledge retained in llvm.assume (operand bundles)

This patch integrates operand bundle llvm.assumes [0] with the
Attributor. Most IRAttributes will now look at uses of the associated
value and if there are llvm.assume operand bundle uses with the right
tag we will check if they are in the must-be-executed-context (around
the context instruction). Droppable users, which is currently only
llvm::assume, are handled special in some places now as well.

[0] http://lists.llvm.org/pipermail/llvm-dev/2019-December/137632.html

2 years agoRevert "Convert a reachable llvm_unreachable into an assert."
Revert "Convert a reachable llvm_unreachable into an assert."

This reverts commit 4a0267e3ad8c4d47f267d7d960f127e099fb4818.

2 years ago[Darwin] Add another hint to find the kernel. NFC.
[Darwin] Add another hint to find the kernel. NFC.

2 years ago[mlir] Clarify constraint on derived attribute
[mlir] Clarify constraint on derived attribute

The restriction that a derived attribute should represent an
attribute/be materializable as an attribute was not made clear.

2 years ago[lldb/DWARF] Reland: Use DW_AT_call_pc to determine artificial frame address
[lldb/DWARF] Reland: Use DW_AT_call_pc to determine artificial frame address

Reland with changes: the test modified in this change originally failed
on a Debian/x86_64 builder, and I suspect the cause was that lldb looked
up the line location for an artificial frame by subtracting 1 from the
frame's address. For artificial frames, the subtraction must not happen
because the address is already exact.


lldb currently guesses the address to use when creating an artificial
frame (i.e., a frame constructed by determining the sequence of (tail)
calls which must have happened).

Guessing the address creates problems -- use the actual address provided
by the DW_AT_call_pc attribute instead.

Depends on D76336.


2 years ago[X86] Disable autoupgrade support for avx512.mask.broadcasti32x2.* and avx512.mask...
[X86] Disable autoupgrade support for avx512.mask.broadcasti32x2.* and avx512.mask.broadcastf32x2.*.

These intrinsics take a v4i32/v4f32 input and are supposed to
broadcast elements 0 and 1. Instead the autoupgrade code was
broadcasting elements 0, 1, 2, and 3.

I could fix the autoupgrade, but since its been broken for years
it seemed better just to steer anyone still trying to use it away

2 years ago[CodeGen] Add an alignment attribute to all sret parameters
[CodeGen] Add an alignment attribute to all sret parameters

This fixes a miscompile when the parameter is actually underaligned.

2 years ago[libc++] NFC: Reuse the TEST_CONCAT macro instead of reimplementing one
[libc++] NFC: Reuse the TEST_CONCAT macro instead of reimplementing one

2 years ago[lldb] Always log if acquiring packet sequence mutex fails
[lldb] Always log if acquiring packet sequence mutex fails

Currently we only log in debug builds but I don't see why we would do this as this is neither
expensive and seems useful.

I looked into the git history of this code and it seems originally there was also an assert here
and the logging here was the #else branch branch for non-Debug builds.

2 years agoRevert "[lldb/DWARF] Use DW_AT_call_pc to determine artificial frame address"
Revert "[lldb/DWARF] Use DW_AT_call_pc to determine artificial frame address"

This reverts commit 6905394d153960ded3a7b884a9747ed2d4a6e8d8. The
changed test is failing on Debian/x86_64, possibly because lldb is
subtracting an offset from the DW_AT_call_pc address used for the
artificial frame:


/home/worker/lldb-x86_64-debian/lldb-x86_64-debian/llvm-project/lldb/test/API/functionalities/tail_call_frames/unambiguous_sequence/main.cpp:6:17: error: CHECK-NEXT: expected string not found in input
 // CHECK-NEXT: frame #1: 0x{{[0-9a-f]+}} a.out`func3() at main.cpp:14:3 [opt] [artificial]
<stdin>:3:2: note: scanning from here
 frame #1: 0x0000000000401127 a.out`func3() at main.cpp:13:4 [opt] [artificial]

2 years ago[VectorCombine] add tests for bitcast (shuffle); NFC
[VectorCombine] add tests for bitcast (shuffle); NFC

2 years ago[lldb][NFC] Always update m_cache_{hits/misses} in FormatCache
[lldb][NFC] Always update m_cache_{hits/misses} in FormatCache

These two variables are only incremented under LLDB_CONFIGURATION_DEBUG but their
value is always logged when verbose lldb formatter logging is enabled, which causes that our
cache hit/miss log looks like this in non-Debug builds:

Cache hits: 0 - Cache Misses: 0
Cache hits: 0 - Cache Misses: 0
Cache hits: 0 - Cache Misses: 0

This just always increments those two counters independent of build mode.

2 years ago[lldb] Don't dump the frame in SBTarget::EvaluateExpression in LLDB_CONFIGURATION_DEBUG
[lldb] Don't dump the frame in SBTarget::EvaluateExpression in LLDB_CONFIGURATION_DEBUG

Dumping the frame using the user-set format could cause that a debug LLDB doesn't behave as a release LLDB,
which could potentially break replaying a reproducer.

Also it's kinda strange that the frame format set by the user is used in the internal log output.

2 years ago[mlir] Revamp operation documentation generation
[mlir] Revamp operation documentation generation

This revisions performs several cleanups to the generated dialect documentation:
* Standardizes format of attributes/operands/results sections
* Splits out operation/type/dialect documentation generation to allow for composing generated and hand-written documentation
* Add section for declarative assembly syntax and successors
* General cleanup

2 years agoRe-land "Avoid emitting unreachable SP adjustments after `throw`"
Re-land "Avoid emitting unreachable SP adjustments after `throw`"

This reverts commit 4e0fe038f438ae1679eae9e156e1f248595b2373. Re-lands

After landing 5ff5ddd0adc89f8827b345577bbb3e7eb74fc644 to add int3 into
trailing unreachable blocks, we can now remove these extra stack
adjustments without confusing the Win64 unwinder. See
https://llvm.org/45064#c4 or X86AvoidTrailingCall.cpp for a full

Fixes PR45064.

2 years ago[lit] Allow passing extra commands to executeShTest
[lit] Allow passing extra commands to executeShTest

This allows creating custom test formats on top of `executeShTest` that
inject commands at the beginning of the file being parsed, without
requiring these commands to physically appear in the test file itself.

For example, one could define a test format that prints out additional
debug information at the beginning of each test. More realistically,
this has been used to define custom test formats like one that supports
compilation failure tests (e.g. with the extension `compile.fail.cpp`)
by injecting a command that calls the compiler on the file itself and
expects it to fail.

Without this change, the only alternative is to create a temporary file
with the same content as the original test, then prepend the desired
`// RUN:` lines to that file, and call `executeShTest` on that file
instead. This is both slow and cumbersome to do.

2 years ago[lldb/DWARF] Use DW_AT_call_pc to determine artificial frame address
[lldb/DWARF] Use DW_AT_call_pc to determine artificial frame address

lldb currently guesses the address to use when creating an artificial
frame (i.e., a frame constructed by determining the sequence of (tail)
calls which must have happened).

Guessing the address creates problems -- use the actual address provided
by the DW_AT_call_pc attribute instead.

Depends on D76336.


2 years ago[DWARF] Emit DW_AT_call_pc for tail calls
[DWARF] Emit DW_AT_call_pc for tail calls

Record the address of a tail-calling branch instruction within its call
site entry using DW_AT_call_pc. This allows a debugger to determine the
address to use when creating aritificial frames.

This creates an extra attribute + relocation at tail call sites, which
constitute 3-5% of all call sites in xnu/clang respectively.


2 years agoNFC: Fix typos in TestingGuide documentation
NFC: Fix typos in TestingGuide documentation

2 years ago[libomptarget][nfc] Explicitly static function scope shared variables
[libomptarget][nfc] Explicitly static function scope shared variables

[libomptarget][nfc] Explicitly static function scope shared variables

`__shared__` in CUDA implies static in function scope. See e.g. D.2.1.1
in CUDA_C_Programming_Guide.pdf,

This is surprising for non-cuda developers, see e.g. D73239 where I thought
local variables would be thread local.

Tested by IR diff of libomptarget.bc (no change), running in tree tests,
and binary diff of the nvcc static archives (no significant change).

2 years ago[lit] NFC: Document missing result codes
[lit] NFC: Document missing result codes

These result codes already exist, but they were not documented. I assume
this is an oversight when adding these result codes.

2 years ago[DivRemPairs] Freeze operands if they can be undef values
[DivRemPairs] Freeze operands if they can be undef values

DivRemPairs is unsound with respect to undef values.

      // bb1:
      //   %rem = srem %x, %y
      // bb2:
      //   %div = sdiv %x, %y
      // -->
      // bb1:
      //   %div = sdiv %x, %y
      //   %mul = mul %div, %y
      //   %rem = sub %x, %mul

If X can be undef, X should be frozen first.
For example, let's assume that Y = 1 & X = undef:
   %div = sdiv undef, 1 // %div = undef
   %rem = srem undef, 1 // %rem = 0
   %div = sdiv undef, 1 // %div = undef
   %mul = mul %div, 1   // %mul = undef
   %rem = sub %x, %mul  // %rem = undef - undef = undef

Same for Y. If X = 1 and Y = (undef | 1), %rem in src is either 1 or 0,
but %rem in tgt can be one of many integer values.

This resolves https://bugs.llvm.org/show_bug.cgi?id=42619 .

This miscompilation disappears if undef value is removed, but it may take a while.
DivRemPair happens pretty late during the optimization pipeline, so this optimization seemed as a good candidate to fix without major regression using freeze than other broken optimizations.

2 years ago[SelectionDAG] Don't crash when freezing illegal float types
[SelectionDAG] Don't crash when freezing illegal float types

2 years ago[X86][AVX] Add some v32i16 to v32i8 style truncation shuffle tests
[X86][AVX] Add some v32i16 to v32i8 style truncation shuffle tests

2 years agoAMDGPU/GlobalISel: Add more tests for add3 folding
AMDGPU/GlobalISel: Add more tests for add3 folding

Forget to squash into 2ea46051055b37faf95c58daad57608bb7610f58

2 years agoAMDGPU/GlobalISel: Add some more tests for add3 folding
AMDGPU/GlobalISel: Add some more tests for add3 folding

These currently fail to form add3 due to the pointer type, but they
should be handle.

2 years agoAMDGPU/GlobalISel: Fix smrd loads of v4i64
AMDGPU/GlobalISel: Fix smrd loads of v4i64

2 years ago[ValueTracking] improve undef/poison analysis for constant vectors
[ValueTracking] improve undef/poison analysis for constant vectors

Differential Revision: https://reviews.llvm.org/D76702

2 years ago[lldb] Remove some debugging printfs from ITSession code
[lldb] Remove some debugging printfs from ITSession code

This seems only useful for debugging and it's just plainly printf'ing to the console instead
of some log, so let's remove this.

2 years ago[gn build] Port b91905a2637
[gn build] Port b91905a2637

2 years agoRevert "Include static prof data when collecting loop BBs"
Revert "Include static prof data when collecting loop BBs"

This reverts commit 129c911efaa492790c251b3eb18e4db36b55cbc5.

Due to an internal benchmark regression.

2 years ago[gn build] (manually) port 8140f6bcde4 better
[gn build] (manually) port 8140f6bcde4 better

2 years ago[gn build] (manually) port 8140f6bcde4
[gn build] (manually) port 8140f6bcde4

2 years ago[gn build] Port 49e5a97ec36
[gn build] Port 49e5a97ec36

2 years ago[lldb/Reproducers] Collect files imported by command script import
[lldb/Reproducers] Collect files imported by command script import

Files imported by the script interpreter aren't opened by LLDB so they
don't end up in the reproducer. The solution is to explicitly add them
to the FileCollector.

2 years ago[ARM] Fold VMOVrh VLDR to LDRH
This adds a simple fold to combine VMOVrh load to a integer load.
Similar to what is already performed for BITCAST, but needs to account
for the types being of different sizes, creating an zero extending load.

Differential Revision: https://reviews.llvm.org/D76485

Sanjay Patel [Tue, 24 Mar 2020 15:38:56 +0000 (11:38 -0400)]
[InstSimplify] add tests for freeze(constexpr); NFC

2 years ago[MachinePipeliner] Fix a bug in Output Dependency chains
[MachinePipeliner] Fix a bug in Output Dependency chains

The current implementation collects all Preds/Succs of a Dep of kind Output, creating a long chain and subsequently a schedule with an unnecessarily large II.
Was this done on purpose for a reason I'm missing?

2 years ago[X86][SSE1] Add support for logic+movmsk patterns (PR42870)
[X86][SSE1] Add support for logic+movmsk patterns (PR42870)

rL368506 handled the basic case, but we need to account for boolean logic patterns as well.

2 years ago[ARM][CMSE] Fix clang/test/Driver/save-temps.c test.
[ARM][CMSE] Fix clang/test/Driver/save-temps.c test.

2 years ago[Parser] Fix the assertion crash in ActOnStartOfSwitch stmt.
Haojian Wu [Sat, 21 Mar 2020 12:48:35 +0000 (13:48 +0100)]
After we parse the switch condition, we don't do the type check for
type-dependent expr (e.g. TypoExpr) (in Sema::CheckSwitchCondition), then the
TypoExpr is corrected to an invalid-type expr (in Sema::MakeFullExpr) and passed
to the ActOnStartOfSwitchStmt, which triggers the assertion.

Fix https://github.com/clangd/clangd/issues/311

2 years ago[libc++] Fix installation of cxx_experimental
[libc++] Fix installation of cxx_experimental

cxx_experimental was never installed because ${experimental_lib} always
expands to an empty target. This seems to have been broken by 97d6fcce4ec6.

2 years ago[CUDA][HIP] Add -Xarch_device and -Xarch_host options
[CUDA][HIP] Add -Xarch_device and -Xarch_host options

The argument after -Xarch_device will be added to the arguments for CUDA/HIP
device compilation and will be removed for host compilation.

The argument after -Xarch_host will be added to the arguments for CUDA/HIP
host compilation and will be removed for device compilation.

2 years ago[DWARF] Fix v5 debug_line parsing of prologues with many files
[DWARF] Fix v5 debug_line parsing of prologues with many files

The directory_count and file_name_count fields are (section 6.2.4 of
DWARF5 spec) supposed to be uleb128s, not bytes. This bug meant that it
was not possible to correctly parse headers with more than 128 files or

I've found this bug by code inspection, though the limit is so small
someone would have run into it for real sooner or later. I've verified
that the producer side handles many files correctly, and that we are
able to parse such files after this fix.

2 years ago[SelDag] Add FREEZE
[SelDag] Add FREEZE

- Add FREEZE node to SelDag
- Lower FreezeInst (in IR) to FREEZE node
- Add Legalization for FREEZE node

2 years ago[InstSimplify] add more tests for freeze(constant); NFC
[InstSimplify] add more tests for freeze(constant); NFC

These should really be moved over to a ConstantFolding test file,
but since this may overlap with the in-progress D76010 and similar
tests already exist here, we can do that as a later cleanup.

2 years ago[lld-link] Support /map option, matching link.exe 's /map output format
[lld-link] Support /map option, matching link.exe 's /map output format

Added support for /map and /map:[filepath].
The output was derived from Microsoft's Link.exe output when using that same option.
Note that /MAPINFO support was not added.

The previous implementation of MapFile.cpp/.h was meant for /lldmap, and was renamed to LLDMapFile.cpp/.h
MapFile.cpp/.h is now for /MAP
However, a small fix was added to lldmap, replacing a std::sort with std::stable_sort to enforce reproducibility.

2 years agoData formatters: fix detection of C strings
Data formatters: fix detection of C strings

Detection of C strings does not work well for pointers. If the value object holding a (char*) pointer does not have an address (e.g., if it is a temp), the value is not considered a C string and its formatting is left to DumpDataExtractor rather than the special handling in  ValueObject::DumpPrintableRepresentation. This leads to inconsistent outputs, e.g., in escaping non-ASCII characters. See the test for an example; the second test expectation is not met (without this patch). With this patch, the C string detection only insists that the pointer value is valid. The patch makes the code consistent with how the pointer is obtained in ValueObject::ReadPointedString.

2 years ago[X86][SSE1] Add additional logic+movmsk patterns that scalarize (PR42870)
[X86][SSE1] Add additional logic+movmsk patterns that scalarize (PR42870)

rL368506 handled the basic case, but we need to account for boolean logic patterns as well.

2 years ago[mlir][StandardToSPIRV] Add support for lowering unary ops
[mlir][StandardToSPIRV] Add support for lowering unary ops

2 years ago[ConstantRange] Add initial support for binaryXor.
Florian Hahn [Tue, 24 Mar 2020 12:47:24 +0000 (12:47 +0000)]
The initial implementation just delegates to APInt's implementation of
XOR for single element ranges and conservatively returns the full set

2 years ago[CodeGen] Fix test attr-noreturn.c when run from my home directory
[CodeGen] Fix test attr-noreturn.c when run from my home directory

2 years ago[AST] Use TypeDependence bitfield to calculate dependence on Types. NFC
[AST] Use TypeDependence bitfield to calculate dependence on Types. NFC

This clears the way for adding an Error dependence bit to Type and having it
mostly-automatically propagated.

2 years agoMake helpers static. NFC.
Make helpers static. NFC.

2 years agoFix unused variable warning
Fix unused variable warning

2 years agoIncrease DIAG_SIZE_DRIVER as we're close to hitting it
Increase DIAG_SIZE_DRIVER as we're close to hitting it

2 years ago[ReleaseNotes,ARM] MVE intrinsics are all implemented!
[ReleaseNotes,ARM] MVE intrinsics are all implemented!

The next release of LLVM will support the full ACLE spec for MVE intrinsics,
so it's worth saying so in the release notes.

2 years ago[clangd] Change line break behaviour for hoverinfo
[clangd] Change line break behaviour for hoverinfo

`parseDocumentation` retains hard line breaks and removes soft line
breaks inside documentation comments.
Wether a line break is hard or soft is determined by the following rules
(some of which have been discussed in

Line breaks that are preceded by a punctuation are retained
Line breaks that are followed by "interesting characters" (e.g. Markdown
syntax, doxygen commands) are retained
All other line breaks are removed

Related issue: https://github.com/clangd/clangd/issues/95

2 years ago[lldb][NFC] Mark GetNextPersistentVariableName as overriden to silence warning
[lldb][NFC] Mark GetNextPersistentVariableName as overriden to silence warning

This was triggering -Winconsistent-missing-override warnings.

2 years ago[NFC][ARM] Add missing tests
[NFC][ARM] Add missing tests

2 years ago[UpdateTestChecks] Use common ir function name matcher and extend to accept periods...
[UpdateTestChecks] Use common ir function name matcher and extend to accept periods in names (PR37586)

Remove the local versions of the IR_FUNCTION_RE matcher (they weren't doing anything different), and ensure all the function name matchers accept '.' and '-'.

We don't need to use '\.' inside python regex sets either, or '\-' as long as thats at the end of the set.

2 years agotsan: Adding releaseAcquire() to ThreadClock
tsan: Adding releaseAcquire() to ThreadClock

realeaseAcquire() is a new function added to TSan in support of the Go data-race detector.
It's semantics is:

void ThreadClock::releaseAcquire(SyncClock *sc) const {
  for (int i = 0; i < kMaxThreads; i++) {
    tmp = clock[i];
    clock[i] = max(clock[i], sc->clock[i]);
    sc->clock[i] = tmp;

For context see: https://go-review.googlesource.com/c/go/+/220419

2 years ago[ARM][CMSE] Implement CMSE attributes
[ARM][CMSE] Implement CMSE attributes

This patch adds CMSE attributes `cmse_nonsecure_call` and
`cmse_nonsecure_entry`.  As usual, specification is available here:

Patch by Javed Absar, Bradley Smith, David Green, Momchil Velikov,
possibly others.

2 years ago[ARM] Don't split trunc stores that can be better handled as VMOVN
[ARM] Don't split trunc stores that can be better handled as VMOVN

We deliberately split stores of the form
store(truncate(larger-than-legal-type)) into two stores, allowing each
store to perform part of the truncate for free.

There are times however where it makes more sense to use VMOVN to
de-interlace the results back into a single vector, and store that in
one go. This adds a check for that situation, not splitting the store if
it looks like a VMOVN can be more useful.

2 years ago[ARM][LowOverheadLoops] Add checks for narrowing
[ARM][LowOverheadLoops] Add checks for narrowing

Modify ValidateLiveOuts to track 'FalseLaneZeros' more precisely,
including checks on specific operations that can generate non-zeros
from zero values, e.g VMVN. We can then check that any instructions
that retain some information in their output register (all narrowing
instructions) that they only use and def registers that always have
zeros in their falsely predicated bytes, whether or not tail
predication happens.

Most of the logic remains the same, just the names of the data
structures and helpers have been renamed to reflect the change in
logic. The key change, apart from the opcode checkers, is that the
FalseZeros set now strictly contains only instructions which will
always generate zeros, and not instructions that could also have
their false bytes masked away later.

2 years ago[ARM][MVE] Add target flag for narrowing insts
[ARM][MVE] Add target flag for narrowing insts

Add a flag, 'RetainsPreviousHalfElement', for operations that operate
on top/bottom halves of their input and only write to half of their
destination, leaving the other half to retain its previous value.

2 years ago[AST] Add RecoveryExpr to retain expressions on semantic errors
Haojian Wu [Thu, 19 Mar 2020 15:30:40 +0000 (16:30 +0100)]
Normally clang avoids creating expressions when it encounters semantic
errors, even if the parser knows which expression to produce.

This works well for the compiler. However, this is not ideal for
source-level tools that have to deal with broken code, e.g. clangd is
not able to provide navigation features even for names that compiler
knows how to resolve.

The new RecoveryExpr aims to capture the minimal set of information
useful for the tools that need to deal with incorrect code:

source range of the expression being dropped,
subexpressions of the expression.
We aim to make constructing RecoveryExprs as simple as possible to
ensure writing code to avoid dropping expressions is easy.

Producing RecoveryExprs can result in new code paths being taken in the
frontend. In particular, clang can produce some new diagnostics now and
we aim to suppress bogus ones based on Expr::containsErrors.

We deliberately produce RecoveryExprs only in the parser for now to
minimize the code affected by this patch. Producing RecoveryExprs in
Sema potentially allows to preserve more information (e.g. type of an
expression), but also results in more code being affected. E.g.
SFINAE checks will have to take presence of RecoveryExprs into account.

Initial implementation only works in C++ mode, as it relies on compiler
postponing diagnostics on dependent expressions. C and ObjC often do not
do this, so they require more work to make sure we do not produce too
many bogus diagnostics on the new expressions.

See documentation of RecoveryExpr for more details.

original patch from Ilya
This change is based on https://reviews.llvm.org/D61722

2 years ago[lldb-vscode] Add missing launchCommands entry in the package.json
[lldb-vscode] Add missing launchCommands entry in the package.json

2 years ago[PowerPC] fix a typo in commit 3f85134d710c
[PowerPC] fix a typo in commit 3f85134d710c

Implement target hook isProfitableToHoist - typo fix.

2 years agoFix another instance where a variable was renamed in the generated LLVM IR. [NFC]
Fix another instance where a variable was renamed in the generated LLVM IR. [NFC]

2 years ago[Coroutines] Also check lifetime intrinsic for local variable when build
[Coroutines] Also check lifetime intrinsic for local variable when build
coroutine frame

Currently we move all allocas into the frame when build coroutine frame in
CoroSplit pass. However, this can be relaxed.

Since CoroSplit pass run after Inline pass, we can use lifetime intrinsic to
do such analysis: If the scope of lifetime intrinsic is not across any suspend
point, rather than move the allocas to frame, we can just move them to entry bb
of corresponding function. This reduce the frame size.

More importantly, this also avoid data race in multithread environment.
Consider one inline function by coroutine: it starts a thread which access
local variables, while after inline the movement of allocs to frame also access
them. cause data race.

2 years ago[Coroutines] Insert lifetime intrinsics even O0 is used
[Coroutines] Insert lifetime intrinsics even O0 is used

2 years ago[GlobalOpt] Treat null-check of loaded value as use of global (PR35760)
Vedant Kumar [Mon, 23 Mar 2020 22:09:38 +0000 (15:09 -0700)]
PR35760 shows an example program which, when compiled with `clang -O0`
or gcc at any optimization level, prints '0'. However, llvm transforms
the program in a way that causes it to print '1'.

Fix the issue by having `AllUsesOfValueWillTrapIfNull` return false when
analyzing a load from a global which is used by an `icmp`. This special
case was untested [0] so this is just deleting dead code.

An alternative fix might be to change the GlobalStatus analysis for the
global to report "Stored" instead of "StoredOnce". However, "StoredOnce"
is appropriate when only one value other than the initializer is stored
to the global.


2 years ago[MLIR][NFC] flat affine constraints - refactor to share, renames
[MLIR][NFC] flat affine constraints - refactor to share, renames

- refactor to remove duplicate code
- some renaming / comment updates for readability

